모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 게시물ID : programmer_20132
    작성자 : GoToTheMoon
    추천 : 1
    조회수 : 3025
    IP : 211.199.***.233
    댓글 : 0개
    등록시간 : 2017/03/30 15:28:11
    http://todayhumor.com/?programmer_20132 모바일
    어제 답변 받은 내용 간단하게 적어 봅니다 (tesseract, OCR)
    서론
    필기 인식을 하기 위해서 남긴 질문에

    Q. 필기 인식에 관련한 API 는 없을까요?
    A. OCR 방식 또는 머신러닝에 넣을 문자데이터셋을 찾아서 해보세요.

    라는 답변을 얻고 OCR 관련 찾아본 내용을 오유에 남겨둠.



    본론(간단한 조사 및 사용경험에 대한 내용)

    tesseract-ocr 라는 오픈소스 OCR을 찾게 됨. :: 구글에서 지원? 하는 대규모 오픈소스.
    설치및 사용에는 3.05 버전을 사용하려고 함. (2.xx, 4.00 버전등의 상/하위 버전이 존재하며, 3.04,3.05가 안정적인 버젼인것으로 보임.)
    설치후, 문제는 기본언어외의 언어팩을 설치파일에서 추가 할 경우 에러가 발생함. 이른 추가적인 언어의 설치파일이 4.00 버젼의 것을 받아오기 때문에 (설치 과정중에 네트워크를 통한 추가언어를 가져오기 때문) 이 문제는 해당 언어 훈련팩 (TrainedData) 을 따로 받아 프로그램의 폴더에 넣어야 함.

    설치 후, 몇몇 간단한 소스를 테스트 및 기본적인 조사 (구글링) 하면서 알게 된 것들
    1. 사진 통째로 넣어도 인식함. (폭넓은 입력)
    2. 다양한 언어, 기호로 사용가능 (영어부터 한글,한자 및 숫자기호등 다양한 출력형태)
    3. 단일문자,단어처리도 가능. (추가적인 입력변수등으로) 
    4. 출력단어의 유형이 많을수록, 인식률이 저하. (한국어, 한자 같은 언어가 이에 해당) 
    5. 상용프로그램에 비해 낮은 인식률 (4번의 영향이 매우 큰것으로 추정)


    OCR 방식 기본이론
    원래는 스캔 (스캐너) 에 이용되는 방식을 이용해 (TIFF 형식의 파일들) 그 양식을 문자로 치환하는 방식이나 알고리즘
    예전에는 바이너리파일형식 (2진데이터) 뿐이었기 때문에, 이를 문자로 치환 하는 방법.

    가장 실제적인 례로 슈퍼, 편의점의 제품인식용 바코드기기가 가장 기본적인 OCR 하드웨어
    원리상의 이론은 QR 코드도 거의 같은 것으로 생각됨.
    바코드 기기는 1차원배열 (선의 굵기와 간격, 갯수조합) 로 소프트웨어에서 출력
    QR 코드는 2차원배열을 감식함에 있어, 대상의 정보를 기준점 (3개의 큰 기둥점) 과 그 내부정보를 입력받아, 소프트웨어에서 출력
     3개의 기둥은 회전된 경우를 알아보기 위함이고, 내부의 도트들의 위치에 따라 정보를 표시하는것으로 추정된다.

    Tesseract 는 이러한 OCR기기에 있어서 소프트웨어 처리부분에 해당된다고 보여진다.
    tesseract 의 특징은
     - 수평입력 (qr코드와 같은 회전된 경우에 대한 판정 X)
     - 다양한 언어에 맞춰, 해당 훈련팩을 교체하면 된다. (숫자, 영어, 한글 등등 100여 가지의 훈련팩 존재) 


    결과
     본인은 처음에 필기 (혹은 간단한 스캐치) 를 통해서 어떤 유형인지를 판단하기 위한 정도의 수준을 구현하기 위함이었으나, 그 기능 이상의 것들을 쉽게 제공하는 듯 하다.

     tesseract 를 이용해서 필기를 인식 가능한가? 라는 부분에서 결과적으로 yes.
    but, 만약 사용자 유형의 스캐치 (ex ┘, ┐,┌ 등의 기호) 를 얻고자 한다면, 해당 훈련팩을 제작하여 사용해야 한다.
     이는 곧 제스처 입력 (ex 터치스크린 상에서의 처음 접촉 위치에서 드래그되고 떼어낸 위치 까지의 순서경로정보) 에 대한 프로그램 독자유형을 제작할수 있다고 보여진다. 이것은 기본적인 모션인식 기술의 부분이라고 보여진다.) 

     추가적으로 생각된 한글의 입력에 있어서, 한글의 경우 조합형 언어이기 때문에, 글자를 적더라도 한획이 추가될때 마다 다른 글자로 바뀌는 유연성이 타 언어 보다 매우 크다. (그에 따른 혼동도 존재.) 만약 한글필기인식 + OCR 을 사용함에 있어서는 특별한 보정기법을 사용해야 할것으로 생각된다.
     상용 제품(스마트폰) 에는 어느정도 고안된 방법들이 사용되어야 하지만, 실제로는 화면상의 그림을 그대로 문자와 대조-인식하는 OCR 의 기본기법만이 그대로 적용된 것으로 보이지만, 그래도 꽤 괜찮은 수준으로 보인다. 네이버한자검색등의 필기검색은, 한자 찾기가 매우 수월해 보이기도 한다.

     그러나, 필기는 본 의미는 검색용 임시조각이 아니라 말 그대로 "필기" 이다. 필기의 완성은 그것을 필기하고, 다른 사람들이 모두 똑같이 인식되는것으로 바꿔주는 것 (OCR기기의 인식으로 표현하고자 하는 대상의 행동수행) 이 가장 기본적인 목적이라고 생각한다. 

     이 표현에 있어서 독자적인 표현 (중2병문자 인식) 도 가능하기 때문에, 넓은 분야에서 이 기법(도구) 는 즉시 활용 할 가치가 높은것으로 생각된다.


    이상으로 답변 받은 내용에 대한 짧은 조사내용와 개인적인 의견을 남기는 걸로 질문답변에 대한 감사를 표합니다.


    이 게시물을 추천한 분들의 목록입니다.
    [1] 2017/03/31 13:56:37  175.114.***.66  푸른놀  212425
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.

    번호 제 목 이름 날짜 조회 추천
    23438
    아후 서터레스 NeoGenius 24/04/02 17:52 458 1
    23436
    로또 [3] 까망사투리 24/03/11 15:53 924 4
    23434
    copilot 기업유료버전 intelliJ에 붙여서 쓰고있는데 지리네요 안녕월드 24/02/22 00:15 961 0
    23433
    코딩마을 대나무숲 [5] cocoa 24/02/20 14:50 1097 5
    23432
    (질문) 프로그래머분들은 싱글PC게임 레벨제한 풀수 있죠?? [22] 본인삭제금지 할배궁디Lv2 24/02/13 13:36 1172 1
    23431
    Freemium NeoGenius 24/02/13 13:23 776 0
    23429
    부산에서 프로그래머 구인하는데 연봉 6천에서 8천 작은건가 [3] 폴팡 24/02/04 20:50 1354 1
    23427
    chatgpt? bard? [4] 별빛러브 24/01/25 06:24 883 0
    23426
    Next.js로 만들어봤어요~ [3] 창작글 sonnim 24/01/24 12:52 1049 3
    23425
    Spring Boot 공부하기 - 한국투자증권 오픈API 호출 옐로우황 24/01/21 17:51 960 1
    23424
    파이썬 코딩 관련해서 질문드립니다. [4] 투투나 24/01/08 09:49 1177 0
    23423
    9년차 개발자의 "나만의 챗봇" 만들기 with ChatGPT [2] 아자뵤옹 23/12/10 22:35 1368 4
    23420
    이 에러가 뭘까요? [2] +.푸른바다.+ 23/11/03 15:25 1535 1
    23419
    [유니티 코리아] MWU 2023 투표하고 푸짐한 경품 받아가세요! engine1 23/10/06 18:52 1143 0
    23418
    Flutter로 만든 채팅 어플리케이션 with ChatGPT 아자뵤옹 23/09/13 22:39 1625 0
    23417
    특정 페이지 직접 접근 어떻게 막으시나요? [9] 달콤아시타 23/09/10 09:36 1662 0
    23416
    버츄얼 유튜버가 완성한 '세계 최초' 애플 실리콘 GPU 드라이버 펌글 우가가 23/09/02 23:52 1782 2
    23415
    뜨끈뜨끈한 30분짜리 삽질 [9] 창작글 상사꽃 23/08/29 16:00 2043 1
    23414
    [유니티 코리아] MWU 코리아 어워드 2023 마감 임박! mwuaward2023 23/08/26 14:01 1250 0
    23413
    [유니티 코리아] MWU 코리아 어워드 2023 mwuaward2023 23/08/13 19:52 1282 0
    23412
    React.js 공부하기 - REST API 호출(CRUD) 옐로우황 23/08/05 13:13 1497 0
    23411
    영어앱을 만들었는데, 사용자들의 의견 받고 싶습니다! [2] 맑은바다13 23/08/03 18:28 1470 2
    23410
    진짜 절박해서 정말 ㅠㅠ 첫끼간절해서 도움주실분ㅠ.. [3] 명금123 23/07/17 22:28 1568 0
    23409
    [유니티 코리아] MWU 코리아 어워드 2023 mwuaward2023 23/07/04 16:49 1383 0
    23407
    라즈베리파이 파이썬코드에 while문 썼는데 동작을 안해요 [3] 싱그러운햇살 23/06/17 17:18 1667 1
    23405
    라즈베리파이, 스위치 하나 누르면 다른 스위치들도 반응해요 [3] 싱그러운햇살 23/06/15 22:39 1702 1
    23403
    혹시.. 중소기업 재취업 목표.. 공부방법 및 툴 버전 질문드려도 될까요 [2] 베스트금지베오베금지외부펌금지 웃대메템 23/06/13 01:46 1744 0
    23402
    재취업 힘들까요???? [5] 베스트금지베오베금지외부펌금지 웃대메템 23/06/11 00:46 2080 2
    23401
    취미로 만든 채팅 with ChatGpt [4] 아자뵤옹 23/05/11 20:10 2103 4
    23400
    Spring Boot 공부하며 예제 CRUD 웹애플리케이션 정리 옐로우황 23/05/06 11:26 1770 2
    [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [다음10개▶]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈