네이버 "이미지 인식 기술, 구글·타오바오와 격차 줄이겠다"
네이버 "이미지 인식 기술, 구글·타오바오와 격차 줄이겠다"
  • 백종모
  • 승인 2018.05.25 17:09
  • 댓글 0
이 기사를 공유합니다

강유훈 네이버 스마트 렌즈 테크 리더/ 사진=백종모 기자

 

네이버가 이미지 검색 기술을 연내에 향상하겠다는 계획을 밝혔다.

25일 서울 강남구 역삼동 메리츠타워 D2 스타트업팩토리에서 열린 기술포럼에서 강유훈 네이버 스마트 렌즈 테크 리더는 "이미지 검색 분야에서 구글과의 격차는 크지 않다"며 "품질 개선을 통해 간격을 좁혀 나가겠다"고 밝혔다. 

네이버는 지난해 이미지 검색 기능 '스마트 렌즈'와, 이미지로 쇼핑 검색 결과를 제공하는 '쇼핑 렌즈' 서비스를 출시한 바 있다.

강 리더는 "이미지 검색의 서비스 출시 자체는 어렵지 않다. 다만 그 품질을 어떻게 높이느냐가 관건이다"고 밝혔다.

그는 "실제 사용 데이터를 얻기 위해 이미지 검색 서비스를 우선 출시한 면도 있다"며 "올해 말 정도가 되면 실제로 사용할 수 있을 만큼 성능이 향상될 것"이라고 말했다. 

강 리더는 현재 네이버의 이미지 검색에 대해 "현재 70점 정도 된다고 자평한다"며 "올해 연말 쯤에는 상당히 개선될 것이다. 목표는 95~97점"이라고 밝혔다.

이미지 검색 기술 수준을 높이기 위해서는 데이터가 좀 더 폭넓게, 그리고 정확하게 저장되도록 해야 한다. 강 리더는 "회사 간의 기술 자체는 차이가 없으나, 그 적용과 구축에 따라 검색 결과가 달라진다"고 설명했다.

네이버는 지난해 인수한 네이버랩스유럽(구 제록스리서치센터유럽)과 공동으로 데이터 검색 방식을 개선하는 연구를 하고 있다.

강 리더는 "이미지 검색은 구글을 의식하거나 한국에서만 하려고 시작한 것은 아니다. 세계 최고가 되고 싶은 마음에서 시작했다"며 "앞으로 품질 개선을 위해 노력하겠다"고 다짐했다.

그는 "구글보다 중국이 더 무서울 수 있다. 특히 타오바오는 10억에 육박하는 상품 데이터를 갖고 있는데, 데이터 커버리지에서 우리보다 우위인 것은 사실"이라며 "그 격차를 줄이는 다양한 시도를 하고 있다"고 밝혔다.

 

사진=백종모 기자
사진=백종모 기자

다음은 발표 이후 이어진 Q&A 주요 내용

-구글보다 연구 인력과 데이터 확보가 부족해서 점점 더 격차가 벌어지는 것 아닌가?

구글보다 중국이 더 무서울 수 있다. 타오바오에서 검색해보면 네이버 검색 결과 이미지를 가져가서 중국말을 붙여서 쓰더라. 타오바오 같은 회사는 10억에 육박하는 상품 데이터를 갖고 있는 것으로 알고 있다. 데이터 커버리지(범위)에서 타오바오가 우리보다 우위에 있는 것은 사실이다. 그 격차를 줄이는 다양한 시도를 하고 있고, 올해 내에 결과가 나올 것으로 기대하고 있다.

-파파고(네이버의 번역 서비스)와 연계할 계획은 없나?

이미 파파고 앱으로 이미지 입력 값을 받아 OCR(광학 문자 판독)을 하고 있다. 다만 아직까지 정확도가 떨어지는 상태다

-네이버 이미지 검색 서비스 수준 향상을 위해, 외국 데이터를 수집할 계획이 있나?

라인(LINE·네이버의 메신저 앱)이 진출한 국가에서는 네이버가 집중적으로 뭔가를 할 수 있을 것이다. 그 쪽과 기술 연계가 되면 그 나라에서 이미지 검색 관련 서비스를 할 수 있을 것이다.

-디스플레이가 탑재된 인공지능 스피커를 개발 중이라 알고 있다. 여기에 스마트 렌즈 기술이 적용되나?

지금은 그 여부에 대해 확답을 할 수 없는 상황이다. 다만 개인적으로 디스플레이와 카메라가 있는 기기에 스마트 렌즈 기술을 쓰는 것은 자연스럽다고 생각한다.

사진=백종모 기자
사진=백종모 기자

-스마트 렌즈와 쇼핑 렌즈 외에 앞으로 추가될 렌즈가 있나?

현재 다른 렌즈 출시 계획은 없다. 지난해에 막 '서비스 출시'라는 1차 목표를 달성했다. 올해는 출시된 서비스를 통해 얻은 정보로 진일보한 '품질 개선'을 이루는 것이 목표다.

-그동안 많이 검색된 쿼리가 있나?

우리가 빨리 서비스를 출시한 몇 가지 이유 중 하나가 사용자가 왜 이미지 검색을 하는지 알아내는 것이다. 그에 맞춰 품질 개선을 할 수 있기 때문이다. 구체적으로 밝힐 수는 없지만 주요 쿼리 군이 6개 정도 있는 것으로 파악하고 있다.

-구체적인 사진 인식과 학습 과정은?

처음에 사진을 인식시키려면 백과사전 형식의 데이터를 갖춰야 한다. 이후에는 비슷한 데이터를 찾아 학습한 뒤 그것을 기반으로 데이터를 확장시킨다. 이러한 작업을 반복하면서 학습이 이뤄진다.

-베타 서비스 중인 쇼핑 렌즈의 구매 실적은 어느 정도 수준인가.

구체적으로 밝힐 수는 없지만, 의미 있는 수준은 아니다. 1~2년 뒤에는 수익도 기대해보는 단계가 될 것이다.

-쇼핑 렌즈나 스마트 렌즈를 다른 사이트에 개방할 수 있나?

그런 식의 방향성은 생각하고 있지 않다.

-네이버의 스마트 렌즈와 구글 렌즈의 지향점 차이는?

구글의 지향점을 정확히 파악하기는 어렵다. 일단은 비주얼 서치가 구글 어시스트에 포함돼 있어, 인공지능 비서와의 음성 대화가 목적인 것으로 보인다. 가령 '저 꽃이 뭔지 알려줘'라고 물어보면 꽃 이름을 알려주고 끝나는 식이다. 네이버의 경우 음성과의 연결보다는 전형적인 비주얼 서치 형태가 될 것이다. 일치하는 이미지나 유사한 이미지를 모아서 보여주는 방향이다.

-중국 회사와 구글 렌즈의 강점을 꼽는다면?

우리의 모델링이 확실히 그들보다 좋다고 할 수는 없다. 결국, 네이버 비주얼 서치의 장점은 네이버 UGC(사용자 생산 콘텐츠) 데이터인 것 같다. 처음보는 상품을 찍었는데, 네이버 카페 어디선가 튀어나오기도 한다. 직접 현지에 가서 상품을 구매해서 찍어 놓은 경우도 있더라. 네이버 UGC 데이터는 보물 같은 존재이자 우리의 가장 큰 강점이다.

백종모 기자 phanta@dailysmart.co.kr



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.