모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 오유인페이지
    개인차단 상태
    GoToTheMoon님의
    개인페이지입니다
    가입 : 14-11-18
    방문 : 1214회
    닉네임변경 이력
    회원차단
    회원차단해제
    게시물ID : programmer_20132
    작성자 : GoToTheMoon
    추천 : 1
    조회수 : 3030
    IP : 211.199.***.233
    댓글 : 0개
    등록시간 : 2017/03/30 15:28:11
    http://todayhumor.com/?programmer_20132 모바일
    어제 답변 받은 내용 간단하게 적어 봅니다 (tesseract, OCR)
    <div>서론</div> <div>필기 인식을 하기 위해서 남긴 질문에</div> <div><br></div> <div>Q. 필기 인식에 관련한 API 는 없을까요?</div> <div>A. OCR 방식 또는 머신러닝에 넣을 문자데이터셋을 찾아서 해보세요.</div> <div><br></div> <div>라는 답변을 얻고 OCR 관련 찾아본 내용을 오유에 남겨둠.</div> <div><br></div> <div><br></div> <div><br></div> <div>본론(간단한 조사 및 사용경험에 대한 내용)</div> <div><br></div> <div>tesseract-ocr 라는 오픈소스 OCR을 찾게 됨. :: 구글에서 지원? 하는 대규모 오픈소스.</div> <div>설치및 사용에는 3.05 버전을 사용하려고 함. (2.xx, 4.00 버전등의 상/하위 버전이 존재하며, 3.04,3.05가 안정적인 버젼인것으로 보임.)</div> <div>설치후, 문제는 기본언어외의 언어팩을 설치파일에서 추가 할 경우 에러가 발생함. 이른 추가적인 언어의 설치파일이 4.00 버젼의 것을 받아오기 때문에 (설치 과정중에 네트워크를 통한 추가언어를 가져오기 때문) 이 문제는 해당 언어 훈련팩 (TrainedData) 을 따로 받아 프로그램의 폴더에 넣어야 함.</div> <div> <a target="_blank" href="https://github.com/tesseract-ocr/tesseract" target="_blank">Tesseract 깃저장소</a></div> <div> <a target="_blank" href="https://github.com/tesseract-ocr/tesseract/wiki/Data-Files" target="_blank">Tesseract 훈련팩</a></div> <div><br></div> <div>설치 후, 몇몇 간단한 소스를 테스트 및 기본적인 조사 (구글링) 하면서 알게 된 것들</div> <div>1. 사진 통째로 넣어도 인식함. (폭넓은 입력)</div> <div>2. 다양한 언어, 기호로 사용가능 (영어부터 한글,한자 및 숫자기호등 다양한 출력형태)</div> <div>3. 단일문자,단어처리도 가능. (추가적인 입력변수등으로) </div> <div>4. 출력단어의 유형이 많을수록, 인식률이 저하. <span style="font-size:9pt;">(한국어, 한자 같은 언어가 이에 해당) </span></div> <div> <div>5. <a target="_blank" href="http://sehyo88.tistory.com/entry/tesseractocr-%EC%97%90%EC%84%9C-%ED%95%9C%EA%B8%80-%EB%AC%B8%EC%9E%90%EC%9D%B8%EC%8B%9D%EC%9D%98-%EB%AC%B8%EC%A0%9C%EC%A0%90" target="_blank">상용프로그램에 비해 낮은 인식률</a> (4번의 영향이 매우 큰것으로 추정)</div></div> <div><span style="font-size:9pt;">6. <a target="_blank" href="https://groups.google.com/forum/#!topic/tesseract-ocr/i_102U2GONg" target="_blank">낮은 인식률에 대해서는 이미지보정 + 경험적&보정 적인 방법을 사용하면 상용프로그램을 이길 수 있음.</a> </span></div> <div><br></div> <div><br></div>OCR 방식 기본이론 <div>원래는 스캔 (스캐너) 에 이용되는 방식을 이용해 (TIFF 형식의 파일들) 그 양식을 문자로 치환하는 방식이나 알고리즘</div> <div>예전에는 바이너리파일형식 (2진데이터) 뿐이었기 때문에, 이를 문자로 치환 하는 방법.</div> <div><br></div> <div>가장 실제적인 례로 슈퍼, 편의점의 제품인식용 바코드기기가 가장 기본적인 OCR 하드웨어</div> <div>원리상의 이론은 QR 코드도 거의 같은 것으로 생각됨.</div> <div>바코드 기기는 1차원배열 (선의 굵기와 간격, 갯수조합) 로 소프트웨어에서 출력</div> <div>QR 코드는 2차원배열을 감식함에 있어, 대상의 정보를 기준점 (3개의 큰 기둥점) 과 그 내부정보를 입력받아, 소프트웨어에서 출력</div> <div> 3개의 기둥은 회전된 경우를 알아보기 위함이고, 내부의 도트들의 위치에 따라 정보를 표시하는것으로 추정된다.</div> <div><span style="font-size:9pt;"><br></span></div> <div><span style="font-size:9pt;">Tesseract 는 이러한 OCR기기에 있어서 소프트웨어 처리부분에 해당된다고 보여진다.</span></div> <div><span style="font-size:9pt;">tesseract 의 특징은</span></div> <div><span style="font-size:9pt;"> - </span><span style="font-size:9pt;">수평입력 (qr코드와 같은 회전된 경우에 대한 판정 X)</span></div> <div><span style="font-size:9pt;"> - 다양한 언어에 맞춰, 해당 훈련팩을 교체하면 된다. (숫자, 영어, 한글 등등 100여 가지의 훈련팩 존재) </span></div> <div><br></div> <div><br></div> <div><span style="font-size:9pt;">결과</span></div> <div><span style="font-size:9pt;"> 본인은 처음에 필기 (혹은 간단한 스캐치) 를 통해서 어떤 유형인지를 판단하기 위한 정도의 수준을 구현하기 위함이었으나, 그 기능 이상의 것들을 쉽게 제공하는 듯 하다.</span></div> <div><span style="font-size:9pt;"><br></span></div> <div><span style="font-size:9pt;"> tesseract 를 이용해서 필기를 인식 가능한가? 라는 부분에서 결과적으로 yes.</span></div> <div><span style="font-size:9pt;">but, 만약 사용자 유형의 스캐치 (ex ┘, ┐,┌ 등의 기호) 를 얻고자 한다면, 해당 훈련팩을 제작하여 사용해야 한다.</span></div> <div><span style="font-size:9pt;"> 이는 곧 제스처 입력 (ex 터치스크린 상에서의 처음 접촉 위치에서 드래그되고 떼어낸 위치 까지의 순서경로정보) 에 대한 프로그램 독자유형을 제작할수 있다고 보여진다. 이것은 기본적인 모션인식 기술의 부분이라고 보여진다.) </span></div> <div><br></div> <div> 추가적으로 생각된 한글의 입력에 있어서, 한글의 경우 조합형 언어이기 때문에, 글자를 적더라도 한획이 추가될때 마다 다른 글자로 바뀌는 유연성이 타 언어 보다 매우 크다. (그에 따른 혼동도 존재.) 만약 한글필기인식 + OCR 을 사용함에 있어서는 특별한 보정기법을 사용해야 할것으로 생각된다.</div> <div> 상용 제품(스마트폰) 에는 어느정도 고안된 방법들이 사용되어야 하지만, 실제로는 화면상의 그림을 그대로 문자와 대조-인식하는 OCR 의 기본기법만이 그대로 적용된 것으로 보이지만, 그래도 꽤 괜찮은 수준으로 보인다. 네이버한자검색등의 필기검색은, 한자 찾기가 매우 수월해 보이기도 한다.</div> <div><br></div> <div> 그러나, 필기는 본 의미는 검색용 임시조각이 아니라 말 그대로 "필기" 이다. 필기의 완성은 그것을 필기하고, 다른 사람들이 모두 똑같이 인식되는것으로 바꿔주는 것 (OCR기기의 인식으로 표현하고자 하는 대상의 행동수행) 이 가장 기본적인 목적이라고 생각한다.<span style="font-size:9pt;"> </span></div> <div><br></div> <div> 이 표현에 있어서 독자적인 표현 <strike>(중2병문자 인식)</strike> 도 가능하기 때문에, 넓은 분야에서 이 기법(도구) 는 즉시 활용 할 가치가 높은것으로 생각된다.</div> <div><br></div> <div><br></div> <div>이상으로 답변 받은 내용에 대한 짧은 조사내용와 개인적인 의견을 남기는 걸로 질문답변에 대한 감사를 표합니다.</div> <div><br></div>

    이 게시물을 추천한 분들의 목록입니다.
    [1] 2017/03/31 13:56:37  175.114.***.66  푸른놀  212425
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.

    번호 제 목 이름 날짜 조회 추천
    54
    인베 필수요소 [8] GoToTheMoon 17/12/01 07:51 180 2
    53
    요즘 롤 하는데 핑이 200~300 왔다갔다 하는거 저만 그런가요? [1] GoToTheMoon 17/06/29 21:46 41 0
    52
    고대주화 패치 때문에 [2] GoToTheMoon 17/06/29 20:10 124 0
    51
    라칸은 좋게 보면 알리스타 상위호환 [1] GoToTheMoon 17/06/22 19:29 69 0
    50
    서리여왕을 가는 이유. (서리여왕 쓰세요) [7] GoToTheMoon 17/06/09 23:30 90 0
    49
    [대회]쓰뤠시 2주 1일차 정리 GoToTheMoon 17/06/07 01:20 77 1
    48
    [대회]1주차 쓰레쉬 정리 GoToTheMoon 17/06/05 00:11 53 3
    47
    [대회]4일차 쓰레쉬의 양상. [1] GoToTheMoon 17/06/04 01:47 102 2
    46
    [대회] 쓰레쉬의 낮은 승률? 이유는 있다. [3] GoToTheMoon 17/06/03 22:50 91 2
    45
    소환사의 규율 [4] GoToTheMoon 17/05/22 07:13 164 0
    44
    원딜없이 투정글이라니 이건 [1] GoToTheMoon 17/05/05 18:40 116 0
    43
    가고일의 돌갑옷 : 탱커들이 더 잘 버티라고 만들었습니다. [2] GoToTheMoon 17/05/03 14:47 164 2
    42
    서폿으로 딜 하고 싶다. . . [13] GoToTheMoon 17/05/02 16:16 167 2
    41
    무효? 기권? 그 차이는 뭘까 GoToTheMoon 17/05/02 09:21 116 0
    40
    [서폿]레오나는 과연 별로인가? [23] GoToTheMoon 17/04/29 07:05 100 3
    39
    대통령 후보가 (혹은 관련자) 가 스팸을 뿌리네요. GoToTheMoon 17/04/25 21:32 63 1
    38
    항공모함 이야기를 듣고 [12] GoToTheMoon 17/04/11 13:40 153 0
    37
    개인향상 (실력/판단) 에 도움이 될 '수' 있는 것들. [2] GoToTheMoon 17/04/06 00:12 74 6
    36
    근접챔피언들이 와드를 더 빨리 제거할수 있어야 하지 않나요? [16] GoToTheMoon 17/04/02 21:23 115 0
    어제 답변 받은 내용 간단하게 적어 봅니다 (tesseract, OCR) GoToTheMoon 17/03/30 15:28 58 1
    34
    필기 인식 관련한 API 는 없을까요? [3] 본인삭제금지 GoToTheMoon 17/03/29 13:07 66 0
    33
    먹거리 X 파일이 흥할수 밖에 없는 문화 GoToTheMoon 17/03/28 16:04 91 1
    32
    오늘의 한줄정리 GoToTheMoon 17/03/21 00:13 83 0
    31
    긴 장문의 글을 쓰는것 보다 [2] GoToTheMoon 17/03/20 02:16 68 0
    30
    [서폿] 기본 유형의 플레이 -카운터- [3] GoToTheMoon 17/03/16 20:11 73 4
    29
    내맘대로 레넥톤 정리 - 악어가죽 [1] GoToTheMoon 17/03/15 00:24 41 0
    28
    횡설수설 징크스 정리 [7] GoToTheMoon 17/03/13 17:52 179 1
    27
    직스, 하세요. 마~니 쏘세요. GoToTheMoon 17/03/12 17:00 77 2
    26
    LCS 도 성립하고 LCK 도 성립하는 이야기 GoToTheMoon 17/02/28 21:18 83 0
    25
    포킹메타가 좀 길어지면. . . 원딜러는 결국 GoToTheMoon 17/02/24 00:12 77 1
    [1] [2]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈