모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 게시물ID : programmer_20132
    작성자 : GoToTheMoon
    추천 : 1
    조회수 : 3023
    IP : 211.199.***.233
    댓글 : 0개
    등록시간 : 2017/03/30 15:28:11
    http://todayhumor.com/?programmer_20132 모바일
    어제 답변 받은 내용 간단하게 적어 봅니다 (tesseract, OCR)
    <div>서론</div> <div>필기 인식을 하기 위해서 남긴 질문에</div> <div><br></div> <div>Q. 필기 인식에 관련한 API 는 없을까요?</div> <div>A. OCR 방식 또는 머신러닝에 넣을 문자데이터셋을 찾아서 해보세요.</div> <div><br></div> <div>라는 답변을 얻고 OCR 관련 찾아본 내용을 오유에 남겨둠.</div> <div><br></div> <div><br></div> <div><br></div> <div>본론(간단한 조사 및 사용경험에 대한 내용)</div> <div><br></div> <div>tesseract-ocr 라는 오픈소스 OCR을 찾게 됨. :: 구글에서 지원? 하는 대규모 오픈소스.</div> <div>설치및 사용에는 3.05 버전을 사용하려고 함. (2.xx, 4.00 버전등의 상/하위 버전이 존재하며, 3.04,3.05가 안정적인 버젼인것으로 보임.)</div> <div>설치후, 문제는 기본언어외의 언어팩을 설치파일에서 추가 할 경우 에러가 발생함. 이른 추가적인 언어의 설치파일이 4.00 버젼의 것을 받아오기 때문에 (설치 과정중에 네트워크를 통한 추가언어를 가져오기 때문) 이 문제는 해당 언어 훈련팩 (TrainedData) 을 따로 받아 프로그램의 폴더에 넣어야 함.</div> <div> <a target="_blank" href="https://github.com/tesseract-ocr/tesseract" target="_blank">Tesseract 깃저장소</a></div> <div> <a target="_blank" href="https://github.com/tesseract-ocr/tesseract/wiki/Data-Files" target="_blank">Tesseract 훈련팩</a></div> <div><br></div> <div>설치 후, 몇몇 간단한 소스를 테스트 및 기본적인 조사 (구글링) 하면서 알게 된 것들</div> <div>1. 사진 통째로 넣어도 인식함. (폭넓은 입력)</div> <div>2. 다양한 언어, 기호로 사용가능 (영어부터 한글,한자 및 숫자기호등 다양한 출력형태)</div> <div>3. 단일문자,단어처리도 가능. (추가적인 입력변수등으로) </div> <div>4. 출력단어의 유형이 많을수록, 인식률이 저하. <span style="font-size:9pt;">(한국어, 한자 같은 언어가 이에 해당) </span></div> <div> <div>5. <a target="_blank" href="http://sehyo88.tistory.com/entry/tesseractocr-%EC%97%90%EC%84%9C-%ED%95%9C%EA%B8%80-%EB%AC%B8%EC%9E%90%EC%9D%B8%EC%8B%9D%EC%9D%98-%EB%AC%B8%EC%A0%9C%EC%A0%90" target="_blank">상용프로그램에 비해 낮은 인식률</a> (4번의 영향이 매우 큰것으로 추정)</div></div> <div><span style="font-size:9pt;">6. <a target="_blank" href="https://groups.google.com/forum/#!topic/tesseract-ocr/i_102U2GONg" target="_blank">낮은 인식률에 대해서는 이미지보정 + 경험적&보정 적인 방법을 사용하면 상용프로그램을 이길 수 있음.</a> </span></div> <div><br></div> <div><br></div>OCR 방식 기본이론 <div>원래는 스캔 (스캐너) 에 이용되는 방식을 이용해 (TIFF 형식의 파일들) 그 양식을 문자로 치환하는 방식이나 알고리즘</div> <div>예전에는 바이너리파일형식 (2진데이터) 뿐이었기 때문에, 이를 문자로 치환 하는 방법.</div> <div><br></div> <div>가장 실제적인 례로 슈퍼, 편의점의 제품인식용 바코드기기가 가장 기본적인 OCR 하드웨어</div> <div>원리상의 이론은 QR 코드도 거의 같은 것으로 생각됨.</div> <div>바코드 기기는 1차원배열 (선의 굵기와 간격, 갯수조합) 로 소프트웨어에서 출력</div> <div>QR 코드는 2차원배열을 감식함에 있어, 대상의 정보를 기준점 (3개의 큰 기둥점) 과 그 내부정보를 입력받아, 소프트웨어에서 출력</div> <div> 3개의 기둥은 회전된 경우를 알아보기 위함이고, 내부의 도트들의 위치에 따라 정보를 표시하는것으로 추정된다.</div> <div><span style="font-size:9pt;"><br></span></div> <div><span style="font-size:9pt;">Tesseract 는 이러한 OCR기기에 있어서 소프트웨어 처리부분에 해당된다고 보여진다.</span></div> <div><span style="font-size:9pt;">tesseract 의 특징은</span></div> <div><span style="font-size:9pt;"> - </span><span style="font-size:9pt;">수평입력 (qr코드와 같은 회전된 경우에 대한 판정 X)</span></div> <div><span style="font-size:9pt;"> - 다양한 언어에 맞춰, 해당 훈련팩을 교체하면 된다. (숫자, 영어, 한글 등등 100여 가지의 훈련팩 존재) </span></div> <div><br></div> <div><br></div> <div><span style="font-size:9pt;">결과</span></div> <div><span style="font-size:9pt;"> 본인은 처음에 필기 (혹은 간단한 스캐치) 를 통해서 어떤 유형인지를 판단하기 위한 정도의 수준을 구현하기 위함이었으나, 그 기능 이상의 것들을 쉽게 제공하는 듯 하다.</span></div> <div><span style="font-size:9pt;"><br></span></div> <div><span style="font-size:9pt;"> tesseract 를 이용해서 필기를 인식 가능한가? 라는 부분에서 결과적으로 yes.</span></div> <div><span style="font-size:9pt;">but, 만약 사용자 유형의 스캐치 (ex ┘, ┐,┌ 등의 기호) 를 얻고자 한다면, 해당 훈련팩을 제작하여 사용해야 한다.</span></div> <div><span style="font-size:9pt;"> 이는 곧 제스처 입력 (ex 터치스크린 상에서의 처음 접촉 위치에서 드래그되고 떼어낸 위치 까지의 순서경로정보) 에 대한 프로그램 독자유형을 제작할수 있다고 보여진다. 이것은 기본적인 모션인식 기술의 부분이라고 보여진다.) </span></div> <div><br></div> <div> 추가적으로 생각된 한글의 입력에 있어서, 한글의 경우 조합형 언어이기 때문에, 글자를 적더라도 한획이 추가될때 마다 다른 글자로 바뀌는 유연성이 타 언어 보다 매우 크다. (그에 따른 혼동도 존재.) 만약 한글필기인식 + OCR 을 사용함에 있어서는 특별한 보정기법을 사용해야 할것으로 생각된다.</div> <div> 상용 제품(스마트폰) 에는 어느정도 고안된 방법들이 사용되어야 하지만, 실제로는 화면상의 그림을 그대로 문자와 대조-인식하는 OCR 의 기본기법만이 그대로 적용된 것으로 보이지만, 그래도 꽤 괜찮은 수준으로 보인다. 네이버한자검색등의 필기검색은, 한자 찾기가 매우 수월해 보이기도 한다.</div> <div><br></div> <div> 그러나, 필기는 본 의미는 검색용 임시조각이 아니라 말 그대로 "필기" 이다. 필기의 완성은 그것을 필기하고, 다른 사람들이 모두 똑같이 인식되는것으로 바꿔주는 것 (OCR기기의 인식으로 표현하고자 하는 대상의 행동수행) 이 가장 기본적인 목적이라고 생각한다.<span style="font-size:9pt;"> </span></div> <div><br></div> <div> 이 표현에 있어서 독자적인 표현 <strike>(중2병문자 인식)</strike> 도 가능하기 때문에, 넓은 분야에서 이 기법(도구) 는 즉시 활용 할 가치가 높은것으로 생각된다.</div> <div><br></div> <div><br></div> <div>이상으로 답변 받은 내용에 대한 짧은 조사내용와 개인적인 의견을 남기는 걸로 질문답변에 대한 감사를 표합니다.</div> <div><br></div>

    이 게시물을 추천한 분들의 목록입니다.
    [1] 2017/03/31 13:56:37  175.114.***.66  푸른놀  212425
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.

    번호 제 목 이름 날짜 조회 추천
    23438
    아후 서터레스 NeoGenius 24/04/02 17:52 446 1
    23436
    로또 [3] 까망사투리 24/03/11 15:53 910 4
    23434
    copilot 기업유료버전 intelliJ에 붙여서 쓰고있는데 지리네요 안녕월드 24/02/22 00:15 947 0
    23433
    코딩마을 대나무숲 [5] cocoa 24/02/20 14:50 1082 5
    23432
    (질문) 프로그래머분들은 싱글PC게임 레벨제한 풀수 있죠?? [22] 본인삭제금지 할배궁디Lv2 24/02/13 13:36 1157 1
    23431
    Freemium NeoGenius 24/02/13 13:23 764 0
    23429
    부산에서 프로그래머 구인하는데 연봉 6천에서 8천 작은건가 [3] 폴팡 24/02/04 20:50 1332 1
    23427
    chatgpt? bard? [4] 별빛러브 24/01/25 06:24 869 0
    23426
    Next.js로 만들어봤어요~ [3] 창작글 sonnim 24/01/24 12:52 1036 3
    23425
    Spring Boot 공부하기 - 한국투자증권 오픈API 호출 옐로우황 24/01/21 17:51 949 1
    23424
    파이썬 코딩 관련해서 질문드립니다. [4] 투투나 24/01/08 09:49 1159 0
    23423
    9년차 개발자의 "나만의 챗봇" 만들기 with ChatGPT [2] 아자뵤옹 23/12/10 22:35 1355 4
    23420
    이 에러가 뭘까요? [2] +.푸른바다.+ 23/11/03 15:25 1523 1
    23419
    [유니티 코리아] MWU 2023 투표하고 푸짐한 경품 받아가세요! engine1 23/10/06 18:52 1129 0
    23418
    Flutter로 만든 채팅 어플리케이션 with ChatGPT 아자뵤옹 23/09/13 22:39 1612 0
    23417
    특정 페이지 직접 접근 어떻게 막으시나요? [9] 달콤아시타 23/09/10 09:36 1650 0
    23416
    버츄얼 유튜버가 완성한 '세계 최초' 애플 실리콘 GPU 드라이버 펌글 우가가 23/09/02 23:52 1767 2
    23415
    뜨끈뜨끈한 30분짜리 삽질 [9] 창작글 상사꽃 23/08/29 16:00 2029 1
    23414
    [유니티 코리아] MWU 코리아 어워드 2023 마감 임박! mwuaward2023 23/08/26 14:01 1236 0
    23413
    [유니티 코리아] MWU 코리아 어워드 2023 mwuaward2023 23/08/13 19:52 1269 0
    23412
    React.js 공부하기 - REST API 호출(CRUD) 옐로우황 23/08/05 13:13 1483 0
    23411
    영어앱을 만들었는데, 사용자들의 의견 받고 싶습니다! [2] 맑은바다13 23/08/03 18:28 1456 2
    23410
    진짜 절박해서 정말 ㅠㅠ 첫끼간절해서 도움주실분ㅠ.. [3] 명금123 23/07/17 22:28 1556 0
    23409
    [유니티 코리아] MWU 코리아 어워드 2023 mwuaward2023 23/07/04 16:49 1369 0
    23407
    라즈베리파이 파이썬코드에 while문 썼는데 동작을 안해요 [3] 싱그러운햇살 23/06/17 17:18 1653 1
    23405
    라즈베리파이, 스위치 하나 누르면 다른 스위치들도 반응해요 [3] 싱그러운햇살 23/06/15 22:39 1689 1
    23403
    혹시.. 중소기업 재취업 목표.. 공부방법 및 툴 버전 질문드려도 될까요 [2] 베스트금지베오베금지외부펌금지 웃대메템 23/06/13 01:46 1730 0
    23402
    재취업 힘들까요???? [5] 베스트금지베오베금지외부펌금지 웃대메템 23/06/11 00:46 2065 2
    23401
    취미로 만든 채팅 with ChatGpt [4] 아자뵤옹 23/05/11 20:10 2087 4
    23400
    Spring Boot 공부하며 예제 CRUD 웹애플리케이션 정리 옐로우황 23/05/06 11:26 1757 2
    [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [다음10개▶]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈