철수네 소프트웨어 세상 [본점]

소프트웨어와 관련이 있다면 뭐든지 – I no longer work for Microsoft.

그리고 페이스북 그래프 검색, 문을 열었다.

leave a comment »

역사상 기술의 발전이 펜듈럼(Pendulum)처럼 왔다 갔다하는 예들은 수없이 많다. 어느쪽으로 흐르는 듯 하더니 이내 다시 저쪽으로 흐른다. 더 작아지기 위한 경쟁을 하더니 더 커지기 위한 경쟁을 한다. 풀파워 PC가 대세인가 했더니 스마트폰에 다 들어있는 모바일 컴퓨팅이 대세다. 스토리지 디바이스들이 편해지면서 데이타가 안방으로 들어오는듯 하더니 다시 클라우드란다. 디렉토리형의 포털이 최강이라고 야후가 뜨더니 검색이 최강이라고 구글이 눌러버린다. 왔다 갔다, 흐름을 잘 파악하는 놈들이 항상 최고가 된다.

하지만, 근래에는 이 펜듈럼이 너무 빨라 더이상 펜듈럼이라고 부를 수가 없을 정도가 된 것 같다. 작아지는 속도도 커지는 속도도 서로 우리가 다음 단계라고 외치면서 IT역사가 쓰여지고 있다. 큰 것이 목표이면 더 크게 작은 것이 목표이면 더 작게, 둘의 밸런스가 목표이면 끝장나는 엔지니어링으로, 세상의 문제들을 풀어나간다. 커지다 못해 작은 것을 엮어서 크게 만들고, 작아지다 못해 나노 크기의 로봇을 만든다. 펜듈럼이라고 하기 힘든 이유 중 하나가 그 중간 지점의 disruption이 여기저기서 동시다발적으로 일어나는 이유도 있고, 크건 작건 서로 convergence 현상이 두드러지기 때문에도 그럴 것이다. 뭐 당연히 이런 현상의 기저에는 인터넷의 역할이 지대했을 것이다. 커지는 트렌드면 작아지는 놈이 묻혔고, 작아지는 트렌드면 커지는 놈이 묻혔지만, 인터넷은 더이상 트렌드를 이렇게 한쪽으로 놔두지 않을 네트웍을 만들었다. 다를 것 같은 두 노드에 링크가 생기면서 단순히 노드에 링크가 생기는 것 뿐만아니라 두 노드가 속한 다른 네트웍이 합쳐지게 된다. 새로운 트렌드에 의해서 새로운 연구가 생겨나고, 새로운 연구는 생각치 못한 결합으로 이전과 다른 방법으로 발전해간다.

현대의 기술에서 개인이라는 것이 더 부각되는 것은 이런 이유에서일 것이다. 이전의 나는 거시적으로 항상 통계의 일부일 뿐이었다. 세일즈 데이타에서 +1이었을 뿐이고, 웹사이트에 수십만 클릭 중에서 하나의 클릭이고, 어떤 트렌드에 리트윗 하나더였고, 게시판에 불평을 하나 올린 한 글쪼가리였었다. 하지만, 이제는 다르다. 개인과 통계의 사이는 더이상 펜듈럼 관계가 아니다. 개인이 부각되는 정도는 이전보다 커졌고, 통계를 움직일 수 있는 요소로 개인이 더 중요한 위치가 되었다. 10년 아니 20년전부터 개인화(Personalization/Customization)를 위한 기술이 뜰 것이라고 떠들어댔지만, 정작 개인화 서비스는 그것을 전면에 내세운 경우 제대로 뜬 것이 “한가지도” 없다. 하지만, 지금 여기에 와서 드디어 개인을 개인 데이타를 가진 한 개체가 아닌 네트웍 상에서 영향을 미치며 살아가는 개체로서 개인화라는 것이 말이 된다는 것이 보이고 있다. 즉 개인을 붕 떠있는 숫자가 달린 개체가 아니라 에너지를 발산하고 받는 전체 안에서의 존재로서 인정하는 기술로 변모하고 있다는 이야기다.

내가 하나의 숫자라면, 그 숫자는 무엇에 의해서 정해질까. IQ라면 얼마, 키라면 얼마. 이 숫자는 상대적으로 봐야할 숫자들이다. 나를 독방에 있는 한 사람으로 생각하고 “개인화”를 하면, 그게 얼마나 개인화된 것일까. 오늘 IQ를 재고 좀 더 지나고 나서 IQ를 또 재면 같게 나올까? 대상을 2명으로 늘려보자. 2명을 두고 둘의 숫자에 맞춰서 다른 서비스를 하는 것이 “개인화”이다. 하지만, 이 둘을 상대적으로 바라보면 또 다른 숫자이다. 단순히 이 둘의 숫자 각각으로 각각 다른 서비스를 제공하는 것이 아니라, 둘의 상대성으로 서비스를 하는 것이다. 예를들어 A와 B 둘이라고 하자. A가 키가 커서 큰키에 맞춘 서비스를 했다고 하자. B는 A보다 수치적으로 크다고 수집했다. “개인화”서비스라면 둘다 “같은” 큰키 서비스을 받을 것이다. 하지만, 상대적인 키를 생각하면 A는 큰키 서비스, B는 더 큰키 서비스를 제공한 것이 제대로된 “개인화”가 아닐까. (굳이 키를 예로 든 것은 매우 랜덤하다. 정말.) 이것이 둘이 아니고 셋, 스물, 백삼십, 이렇게 늘어났다고 상상해보면 그 속에서 나의 상대성, 그리고 나의 영향력이 이전보다 커졌음을 생각해볼 수 있다. 홀로 독방에서 산다면 상대성이 필요없겠지만, 현실은 그렇지 않다. 난 친구들 그룹에 따라 크기도 하고 작기도 하다. 어떤 서비스를 하기 위해서는 그 개인에 촛점을 맞추는 것은 그 상대성을 가져야되는데, 이는 쉽지 않다. 그것이 “개인화”였다.

대충 15년전 페이지랭크 한가지 신호를 가지고 구글은 검색엔진을 만들고 사람들에게 효과적이라는 호응을 얻었다. 물론 “개인”이라는 요소보다는 “링크” 즉 “페이지”를 주체로 하는 패러다임이었지만, 개인의 신호가 통계적으로 묻어있는 그 신호를 잘 활용하는 것으로 이런 상대성이 얼마나 효과적인 것인가를 증명했다. 그리고, 지금의 검색 엔진은 “페이지”나 “클릭”같은 기계적인 신호 수백가지를 가지고 더 나은 결과를 보여주기 위해서 열심히 삽질중이다. 물론 이런 검색엔진도 수없이 “개인화”를 시도했다. 위에서 언급한대로 개인의 정보를 사회적인 개인이 아니라 독립된 한 개인의 정보로 취급하는 방식으로. 모든 인간이 각자 자기 섬에서 살고 있는 것으로 가정한 방식으로. 이 사람은 이런 검색을 많이 했으니 이런 결과가 더 효율적이겠지식으로. 하지만, 이는 역시나 인과관계에서 결과를 바탕으로 유추한 기계적인 신호이다. 하다못해 엄청난 양의 데이타를 수집하는 구글 애널리틱스도 광고를 기준으로 하는 기계적인 정보를 수집하는 도구였다. 이를 토대로 개인을 분석하고 유추하지만, 여전히 기계적인 신호이다.

이렇게 사용자의 의도를 캐내서 그에 맞는 결과를 제공하는 서비스들에게 있어서 가장 중요한 것은 “문맥”이다. 이 문맥(분야에 따라 다르게 부르기도 한다)은 다양한 신호로 계산하여 추정하거나 유추된다. 하지만, 어떤 답을 추정하는 것과 사용자가 제공하는 것의 차이는 극명하다. 그것도 사용자의 동의 없이 수집했다가는 큰일난다. 똑똑한 구글이 이를 눈치 못챌리가 없지만, (당연히) 기존의 것을 버릴 수는 없었고 갑자기 사용자들에게 스탠스를 바꿀 수도 없었다. 그러는 새에 페이스북은 그런 데이타를 처음부터 수집할 요량으로 이를 꽉깨물고 마구 수집해갔고, 구글은 도저히 안되겠다! 구글에 뭘 좀 더하자(구글+) 생각한 것이 아니겠는가.

페이스북에는 자발적인 문맥 신호들로 가득하다. 내 나이나 생일, 내가 갔던 곳, 내 친구들 등 explicit한 정보에서부터, 내가 좋아하는 것들, 내 사진속 묻힌 정보들,  내 친구들이 들은 음악들 중에서 선호하는 것들등의 정보를 사용자가 “마구” (반)자발적으로 제공한다 – 구글은 수집에 익숙해있지만, 페북은 사용자들이 자발적으로 “제공”하도록 하는데에 익숙하다. 이들은 기계적인 신호가 아니다. 위에서 예를 든 A와 B처럼 개개인의 상대성과 비슷한 신호이다. 소셜이라는 기술적인 요소는 단순히 한 개인이 소셜한 활동을 할 수 있다는(혹은 있도록 enable한다는) 의미가 아니라, 개인을 독방에서 사는 개인이 아니라 소셜한 개인으로 보고 서비스를 한다는 의미가 있다. 개인이 이전보다 더 소셜해진 것이 주가 아니라, 개인은 이미 소셜했는데 그런 요소는 개인을 파악하는데에 사용하지 못하고(혹은 안하고 혹은 할 생각 조차 못하고 ) 있었다는 것이다. (아직도 많은 “소셜”서비스가 개인을 홀로 독거하는 사람으로밖에 취급하지 않은 경우가 많다.)

페이스북에 왜 검색기능이 없는가에 대한 이야기는 오래전부터 나왔다. 검색엔진에서 수집도 못하고, 검색서비스를 제공하지도 않고. 옛날에 무슨무슨 포스팅을 했었는데, 기억이 가물가물하네…페북의 대답은, 그냥 잊어라…혹은 타임라인에서 하루종일 찾아보든가. 가까운 미래에 추가될 수 있겠지만, 여전히 그 기능은 없다. 페북에서 웹검색? 빙(Bing)검색 결과를 보여주겠다. 혹은 그냥 Bing의 소셜기능이나 구글을 써라. 하지만, 구글이 기존의 검색 방식에 발목이 잡혀있는동안 대신 우리는 이런거 만들었다: 그래프 검색.

그래프 검색은 기존처럼 페이지나 쿼리 기반의 가중치를 둔 검색 서비스가 아니고, 자발적으로 제공된 (그리고 이를 통해 연결된) 그래프 데이타를 기반으로 만든 특정 신호 검색이다. 일단 페북에서 검색을 한다는 자체가 전혀 다른 문맥이라는 점을 캐치한 것이기도 하다. 네이버처럼 올인원을 원하는 것이 아니라면 – 그것이 모바일로 넘어갈때 아이덴티티가 흔들리는 문제로 이어지는 것일 수도 있다 – 굳이 페북에 일반 검색같은 결과를 보여주는 것이 얼마나 효과가 있을까. 기존 검색과 직접적으로 경쟁하는 것이 아니라 공존하는 기능이다. 어차피 “내 (페북)친구가 좋아하는 레스토랑은?”이라는 검색은 검색엔진에서 답을 주지 못하는 섹터이다. 페북 그래프 검색은 처음에는 4가지 종류의 결과를 제공한다고 한다: People, Photo, Places, Interest. 4가지밖에 안된다고 하지만, 이 4가지가 얼마나 큰 것들인지는 어렵지 않게 알 수 있다. 사람/장소/좋아요 검색은 이미 단순 이름 매칭으로 맨위의 검색창에서 일부 가능했고, 사진은 인스타그램을 인수한 페북이니 중요한 한 축이다. 이 기존의 방식에 날개를 단 격이다.

페북 그래프 검색은 사용자들이 자신들의 신호를 더 정제하는 것에 잇점을 제공하는 서비스이다. 알지 못하는 사람의 레스토랑 리뷰와 아는 사람의 레스토랑 리뷰의 차이랄까. 기존의 검색 엔진들은 전자를 (수집해서) 제공했고, 페이스북과 빙의 결합은 후자를 제공하게된다. 검색 엔진은 문서와 링크를 타고 다니면서 정보를 수집하고 문맥을 유추한다. 지식그래프 검색은 사람들이 제공한 정보를 타고 문맥을 제공한다. 소셜 서비스내에서의 검색로써는 분명 정보의 신뢰성에 차이가 있을 것이다. 게다가 명사/동사 기반의 오픈 그래프의 확장도 생각할 일이다. 사람이 키워드, 아이콘, 브랜드, 프로필사진, 등등 하나의 대표성으로 생각하는 경향도 장점으로 작용한다. 검색된 문서 결과가 수천만 혹은 수억 페이지면 뭐하나. 이걸 다 볼건 아니지않나.

물론 문제는 산재해 있다. 영어 자연어 검색이니 다른 언어는 어떻게 될런지도 모르고, 또 개인정보의 공개 비공개의 이슈가 또 있고, 거기에 이를 모네타이즈하게될 것이 뻔한데 그에 대한 걱정도 있다. 그래프검색 SEO도 나올 것이고, 검색 결과에 광고가 뜨면 일반 검색결과 페이지보다 흉(?)할 수 있다. 개인정보 속에 광고가 들어가는 것은 더 민감할 수 있는 사안일 것이다. 개인적으로 타임라인에 Sponsored 포스트가 나오는 것에 대해 굉장히 불만이 많기도 한데 여기도 마찬가지일 것 같다. 어떤 사람들에게는 좋아요를 누르지 않았는데 누른 것처럼 나오는 경우도 많다고 하고, 또 사망한 사람이 좋아요를 누를 경우도 있다고 하는데, 이런 노이즈 신호들은 더 정확한 결과를 보여줘야하는 이 검색 서비스에서 더 증폭될 가능성이 크다. 더불어, 여기서 검색되는 데이타가 엄청나게 크지만, 모두 페북 내의 데이타라는 점도 단점이 될 수 있다. 유행이 지나서 페북을 덜 쓰게 된다면 데이타의 신뢰도는 시간축 신호로 인해서 낮아질 수도 있는 일이다.

마지막으로, 아마존 같은 서비스를 생각해본다. 아마존은 강력한 컨텐트를 가지고 있다. 제품의 팩트와 함께 제품 리뷰와 구매정보 그리고 선호 데이타이다. 하지만, 간단히 내 친구의 제품 리뷰로의 연결은 쉽지않다. 추천하거나 선물하거나 혹은 목록을 만들어서 공유하는 등은 할 수 있지만, 페북과 같은 서비스가 쉽지 않다. 아직도 개인은 독방에서 살고 있고, 옆방의 개인과는 벽을 통해서 간간히 이야기를 할 수 있다. 하지만, 그래프 검색과 같은 서비스가 좀 더 확장될 수 있다면, 이런 정보에 날개가 달릴 날은 멀지 않은 것 같다. 또다른 disruption을 기대해본다. 어차피 내 정보를 가져갈 것이면 기왕이면 제대로 활용 좀 해주라.

Written by charlz

2013년 1월 16일 , 시간: pm 6:34

Uncategorized에 게시됨

댓글 남기기