메뉴 건너뛰기

OBG

정보게시판

조회 수 346 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
구글의 무지막지한 구글 북 서치 프로젝트는 구글의 롱테일 전략의 핵심적인 프로젝트로 유명합니다.  아마존이 Search Inside the Book 프로젝트를 통해 비교적 온건한 방법으로 출판업계와의 윈윈 전략을 가져가고 있는 것에 비해, 구글은 전세계 도서관의 책을 모두 스캔하여 제공하는 프로젝트를 진행함으로써 작가 및 출판사 측과 엄청난 전쟁을 치루기도 했습니다.  물론, 올해 초 테크크런치에 의하면 저작권 협회와 원만한 타결을 이루었다고 하니 앞으로 더욱 주목되는 서비스이기도 합니다.

관련글:  2008/11/14 - 구글의 롱테일 전략 ... 애드센스와 구글 북 서치 프로젝트


그렇지만, 말은 쉬워도 전세계 도서관에 있는 책들을 어떻게 일일이 스캔을 해서 입력을 할 수 있을까요?  인건비도 엄청날텐데 말이지요?  구글의 북 서치 프로젝트가 가능하게 된 것에는, 구글의 기술적인 노우하우가 녹아들어가 있습니다.

구글 북 서치 프로젝트에 있어 기술적으로 가장 중요한 특허가 바로 미국 Patent 7508978 입니다.  이 기계의 기술을 도입하기 전에는 사람들이 손으로 책을 스캔했고, 이 과정에서 책이 파손되는 경우도 많았다고 합니다.  그리고, 책의 내용을 정확히 읽어내기 위해서는 OCR 소프트웨어가 중요한 역할을 했는데, 책이 아주 평평하게 눌려져서 스캔이 되지 않으면 잘못 인식되는 비율이 상당히 높았다고 합니다.  이 문제를 해결하기 위한 기계에 대한 디자인이 7508978 특허에 담겨져 있습니다.  물론 책을 해체해서 낱장 스캔을 하고 다시 붙일 수도 있지만, 책이 손상될 가능성이 너무 많습니다.

구글의 새로운 기계가 하는 역할은 2대의 적외선 카메라 기술을 이용해서 책의 페이지들의 각도와 3차원 형태를 감지하고 이를 OCR 소프트웨어에 전달해서 적절한 변형을 적용하여 OCR 소프트웨어가 보다 정확하게 글자들을 인식하도록 하는 것 입니다. 

결국 핵심은 책을 위를 향하게 놓고, 책의 곡면을 2대의 카메라로 인식한다는 점입니다.  정확한 변형 패턴을 알기 위해 IR 프로젝터가 몇 개의 선의 정보를 책에 투사를 하고, 이를 3차원 적으로 인식해서 페이지 전체의 곡률을 알아낼 수 있습니다.  이를 실시간으로 계산해서 변형되어 보이는 글자들의 형태를 OCR 소프트웨어가 전처리를 통해 펴내는 것이지요.

책의 스캔을 복사기 사용할 때처럼 엎어서 하지 않고, 하늘을 향하게 하고 진행할 수 있다는 점도 흥미롭군요.  저렴한 가격에 만들 수 있다면 팔 수도 있지 않을까? 생각해 보지만, 구글 북 서치처럼 황당한 프로젝트가 아닌 다음에는 책을 저렇게 바로 놓고 스캔할 일은 거의 없겠습니다.

출처 : http://health20.kr/731
?

  1. 무선 인터넷 보안팁 10가지

    Date2009.04.27 CategoryIT By모아레 Views265
    Read More
  2. 구글 북 스캔 기계의 비밀을 파헤친다.

    Date2009.05.11 CategoryIT By모아레 Views346
    Read More
  3. 윈도우 7 - 빠른 실행 되살리기

    Date2009.05.17 CategoryIT By모아레 Views257
    Read More
  4. 윈도우 7 설치시 참고

    Date2009.05.17 CategoryIT By모아레 Views258
    Read More
  5. 윈도우 7 - 최근에 사용한 항목 지우기

    Date2009.05.23 CategoryIT By모아레 Views347
    Read More
  6. 윈도우 7 인증없이 최대 120일 사용하기

    Date2009.05.25 CategoryIT By모아레 Views453
    Read More
  7. 어떻게 해외사이트에 접속할 수 있을까? - 해저 광케이블

    Date2009.06.21 CategoryIT By모아레 Views352
    Read More
  8. 원격 데스크톱 설정

    Date2009.07.15 CategoryIT By모아레 Views329
    Read More
  9. Windows RC? RTM이 뭐야?

    Date2009.07.19 CategoryIT By모아레 Views294
    Read More
  10. 리눅스 서버 운영 초보자를 위한 북마크

    Date2009.07.28 CategoryIT By모아레 Views535
    Read More
  11. 우분투 9.04 기본적인 삽질

    Date2009.08.01 CategoryIT By모아레 Views316
    Read More
  12. 오픈웹 엑스 파일 최종회: 줄기세포는 없다

    Date2009.08.02 CategoryIT By모아레 Views297
    Read More
  13. 커널이란?

    Date2009.08.02 CategoryIT By모아레 Views416
    Read More
  14. 포토샵 간단 강좌

    Date2009.08.17 CategoryIT By모아레 Views270
    Read More
  15. 사용자 계정 컨트롤(UAC 기능)을 끄려면

    Date2009.09.12 CategoryIT By모아레 Views378
    Read More
  16. 안녕리눅스 기본설정

    Date2009.09.18 CategoryIT By모아레 Views351
    Read More
  17. 리눅스 쉘스크립트 실행

    Date2009.09.18 CategoryIT By모아레 Views478
    Read More
  18. 한컴리눅스 2.2 서버구축하기 Apache php Mysql zeroboard

    Date2009.09.24 CategoryIT By모아레 Views554
    Read More
  19. useradd

    Date2009.10.09 CategoryIT By모아레 Views284
    Read More
  20. 윈도우 7 - 내가 작성하는 팁

    Date2009.10.29 CategoryIT By모아레 Views286
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 Next
/ 9
위로