搬家啟事!!
我已經搬家了,請您以後移駕到新家來吧!或是直接訂閱新的部落格!
我在前一篇「黑米不見了!?」裡面,發現在Google怎麼搜「黑米」、搜「HemiDemi」都找不到。不知道是哪一邊的問題。回應裡一則是認為「可能是黑米擋住了Google抓取程式」,另一則認為這是傳說中的Google dance(What's Google dance ?)。事實上是哪一個,我也不知道,但至少到目前為止(05/16 半夜一點半),黑米仍然不知去向。

另外一個比較有趣的回應是,來自我的同班同學Dale,他說:
「這個問題其實很有趣,大家都認為google比較神,但是卻很難真的知道為什麼它比較神,只知道大家都說好,所以就用了(我本人也是)。

我想文彥一定知道在大陸「百度」遠勝於google,原因很多,我認識的大陸朋友跟我聊了不少,單就「search」就好(不談黑暗面),試想:今天你輸入「可樂」的話,你想查到的是什麼?我想應該是「可口可樂」吧!?文彥可以試試看在這兩者輸入可樂的結果有何差異


我對於背後的運算技術幾乎完全不懂,只是單純的好奇這跟「拉丁文或英文」與「中文」本身的性質有關嗎?語言本身的系統會不會影響search的準確度呢?」
OK,既然你都說了,就來搜搜看吧!先來看看百度的:

結果依序是可口可樂中國網站、可樂-百度百科、可樂圈、百度照片,相當中規中矩,而且也滿有univsersal search的感覺,有圖片也有名詞解釋。稍微看一下第一頁,至少百度把「可樂」認定是一種「清涼飲料」,這一點是毫無疑問的。

接下來就看看Google吧!

會把Google放在後面當然是有「梗」的。很難想像世界上最強大的搜尋引擎,搜「可樂」竟然是出現康福旅行社-可樂旅遊,這種怎麼看都像廣告的鳥東西竟然出現在第一名!?第二名仍然是旅遊...還是個會跳轉的網頁。第三第四就更加不知所謂了,滾石可樂根本還沒開站,張可樂又是誰阿,莫非他買了關鍵字廣告?

OK,至少在這個關鍵字上,Google敗得相當徹底,徹底到連大陸人都可以用來當作「百度贏過Google」的證明了。真慘哪。

不過我又延伸了一下,試試看在這兩個搜尋引擎打入Oprah Winfrey,看看結果如何。結果是,兩家搜尋引擎都認識Oprah Winfrey,沒有誤解,可是百度從一開始就吐給你中文網站(百度視頻、百度百科等等),而Google則是給你一堆英文網站,第一個是Oprah的官網。

該怎麼解讀呢?Oprah的官網確實是和Oprah關係最密切的網站沒錯,但以一個搜尋Oprah的中國人來說,他可能更想直接看到視頻、或Oprah的生平事蹟。當然,我們也可以解釋成,百度幾乎沒爬到中國以外的地方去,「只不過」是個有十幾億潛在市場的Local search engine而已,Google才是全世界最強。

大陸雖然很多亂七八糟的公司,但是百度看起來並不是屬於這一類。而是和Google一樣,以技術為導向的科技公司。

在「Google與百度」這本書裡,提到李彥宏在第一次融資時,有三家創投表示有意願投資。其中Peninsula Capital的合夥人之一Greg打了通電話給李彥宏之前在Infoseek的CTO,探探他的底。想不到得到的回答是:「李彥宏在搜尋引擎技術方面,在全世界可以排前三名。」

What?前三名?那在他前面的不頂多是Larry跟Sergey了嗎?如果這種人把全副精力投入在「中文搜尋引擎技術」的話,那在這個領域超過Google也是相當合理的一件事了。

不過話說回來,Google和百度也已經越來越難以用「搜尋引擎公司」來理解了。Google推出的一堆Gmail、Blogger、Picasa、reader、Note、Map、earth...數不清的工具,即使你搜尋技術真的不是最強的,我也跑不了。百度似乎要走向社群化,這點我接觸,就不是很清楚了。反正不同公司,各自走不同的路,服務不同的族群,對廣大網民來說,總是好的。

提供一段影片,讓大家多認識一下李彥宏吧!

Bookmark: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl Bookmark to:YouPush Bookmark to:你推我報

Posted by Gamestu at 痞客邦 PIXNET Comments(12) Trackback(0) Hits(4435)


open trackbacks list Trackbacks (0)

Comments (12)

Post Comment
  • 百度之前還有一個廣告就是針對中文搜尋的。
    你知道,你不知道我......
    你知道你,不知道我.....
    如果逗號位置不同的意思就會不同,這個是Google沒有特別去處理的百度在這方面做的就比較好
  • 這個廣告真有趣!

    逗號這種問題可能是中文特有的,大概也只有百度能夠認真處理這種問題吧!

    Gamestureplied on 2008/05/16 17:29

  • 看來Google的中文Search真的還不夠強
    但是Google比較紅呀~~它已經變大神了~
    這個年頭Content沒有被Google Search到,已經不算是Google的錯了
    不少網站/公司還花錢特別對Google作SEO 想辦法排到前面去
    可能這種中文搜尋怪現像會造成另一種變像的SEO需求~
  • 是阿 我最記得要準時上香的神大概就是Google了吧~

    SEO也是個相當有趣的產業阿~

    Gamestureplied on 2008/05/16 17:31

  • 其實我一直覺得google強是強在他的檢全度,檢準度我沒有很去在意。
    不過在資料廣度夠,利用多加幾個關鍵字來加強檢準也有不錯的效率下,我到是沒有用其他搜尋引擎的意念。
    不過對很多人來說可能就不是這樣,
    在這情形下google的這個服務http://briian.com/?p=5370可能要緩緩了。
  • 其實以一個搜尋引擎來說,競爭力一定是在「檢準度」上面。畢竟搜出來幾百萬筆資料,沒有人會看到三頁之後的結果。如果不準,當然就沒用。

    這也是為甚麼很多新的搜尋引擎公司資料雖少,但卻能夠異軍突起的原因。因為在某個領域裡面,他能夠幫使用者找到比Google更精準的資料。

    當然,以上說法對於比較進階的使用者並不適用,我們自然有辦法找到想要的東西。只是大多數人並不會阿~

    Gamestureplied on 2008/05/16 17:12

  • 我照著你的方式也實作了一次, 發現google如果要像百度一樣第一行就看到"Coca-Cola"的話, 必須打上"可口可樂". 我有想到翻譯的問題, 大多數英翻中的時候, 應該都是前後詞顛倒的. 但是像可口可樂這樣的中間有個連接符號, 應該不至於需要顛倒翻譯才對, 於是我打了"可樂可口"來搜尋, 結果還是找不到. 突然想到.....會不會是在最前面的位置, 是花錢買的??那可樂公司沒有在繁體這部分花錢買嗎??於是乎, 我改了google介面語言"中文(繁體)"-->"中文(簡體)", 結果跟百度一樣. 換上英文界面, 打上"coca", 有出現coca-cola在第一頁, 但是是在第三筆, 如果打上"cola", 前面出現的都是wiki. 還有一個問題是逛了一下可樂公司的網頁, 你會發現這家公司沒有多國語言的界面, 雖然中國和台灣的站名都是coca-cola, 但是都沒有相同的畫面, 跟美國的總公司也沒有, 這或許多少會影響搜尋的結果吧.
  • 你真細心阿~我只有試過「可口可樂」,至於轉簡體繁體就沒試了。

    不過Google的Policy不是說,他們的廣告是不混在搜尋結果的嘛?應該不至於來陰的吧~

    當然也有可能是可口可樂公司的網頁,SEO做得太差,導致可樂旅遊反排在他前面。不過這個我就不太能理解了...。

    SEO真是個神秘的產業...

    Gamestureplied on 2008/05/16 17:36

  • 很有趣的觀察
  • 多謝~

    Gamestureplied on 2008/05/16 17:37

  • 我對SEO不是很清楚,只提供我自己發現的...。
    百度是很好的搜索引擎,但很可惜很多台灣的網站,百度是不會收錄的。
    如果拿雅虎奇摩來跟google來比較,google的優點還是比較多的,比如說google最快可以在幾分鐘之內搜索到網頁並收錄,雅虎奇摩需要一天以上,通常是三天左右。
    雅虎奇摩的搜索排名很容易變動劇烈,但變動的卻又不合邏輯,檢索日期甚至有時會倒退,比如說,明明流量較大的頁面,卻無法得到較好的排名,或是排上去之後,在流量未減的狀況下,排名卻莫名直往下掉,而有些流量未增卻又往上跑。google在程式的運作上則精準許多,合乎邏輯,但可能因為完全由程式控制,所以也會出現極少數奇怪的狀況。
    雅虎奇摩的排名疑似有人員手動調整,以避免程式演算的僵化性。
    雅虎奇摩的排名非常自私,跟雅虎奇摩有關的網頁可以享受較好的待遇,比如說無名的blog、日雅虎的網站免費空間等等,可以輕易獲得較好的排名。
  • 補充一下剛才沒想到的...雅虎奇摩的搜索排名很奇怪,比如說某一個頁面,今天是第9名,過兩天變第15名,又過兩天變成第5名,再過兩天又變回第9名,跳上又跳下,頁面日期甚至會倒退!至於為什麼變動?匪夷所思,可能突然排到很後面後,就打入冷宮,也可以突然被排到很前面,就支持了很久。在這一點上,google就精準多了,邏輯容易理解。
  • 百度真的是相當Local的搜尋引擎,搜不到台灣網站也是很合理的。更何況,很多台灣網站根本是被擋掉的阿~~

    至於雅虎奇摩阿,我是已經好幾年沒用了...所以感覺不到。不過,上次聽雅虎韓總監的演講...,台灣雅虎在搜尋引擎領域,一樣是超級獨占阿。(無奈)

    Gamestureplied on 2008/05/16 17:03

  • 出現「可樂」相關為名的公司或個人,似乎也不算錯誤,尤其當這類的資訊可能可以帶來更高的利益時,而真實世界中確是比較多人進入這些網站的話,先提供這樣的資訊似乎也比較實際,別忘了,Google 有名的 page rank 就是基於這樣的一個立基,是否一定要出現「某個人」想要的資訊,這種想法是不切實際的。

    還有,文中使用「可樂」為例,似乎不甚妥當,雖然關鍵字的下法,因為沒有辦法很好地建立統一的觀念,所以很難清楚的被分類,雖然以「可樂」來說,我的確是會聯想到「可口可樂」,但其實可樂在中文中還可以產生其他聯想,例如還可以想到「可樂果」等等,所以應該算是表意模糊的詞,所以為了要更精確的搜尋到目標,使用「可口可樂」,甚至「coke」、「coca-cola」之類的關鍵字,應該能更加精確。

    刻意的適用模糊性的關鍵字比較,因為認知不一定相同,很容易在討論中失去立場。

    還有出現英文網站的問題,你也可以設定讓 google 只吐中文的網站啊,好像要這樣比好像才有意義吧。
  • 老實說,我並不認同。搜尋引擎的最終目的在於「準確解讀」使用者輸入的詞彙。即使pagerank比較高好了,Google對於「可樂」的解讀竟然跟飲料毫無相關,這怎麼都說不過去。中文能夠聯想的東西實在太多了,可樂=飲料應該已經是大家最認同的聯想。誰在搜尋「可樂」的時候,會期待出現旅遊網站、和張可樂這種結果呢?當然你可以說這「沒有錯」,但是解讀卻是「不準確」的。打死我都不相信認為張可樂-可樂之間的關係比可口可樂-可樂之間的關係密切的人會比較多阿!

    還有,如果你要說Page rank的話,可口可樂台灣的網站,page rank是6。滾石可樂是5、張可樂是3。還有什麼角度能夠解釋搜尋「可樂」時,「張可樂」應該擺在「可口可樂」之前呢?

    至於出現英文網站,我並不覺得那是Google的「問題」阿...,我文中也沒有認為誰好誰壞吧...?僅僅是一個較國際化、一個較Local而已,各有各的強項阿。

    還有,我是以「服務」的角度來看,而非「技術」的角度。對大眾使用者來說,一切需要「設定」的東西,都是技術的範疇。

    Gamestureplied on 2008/05/16 16:59

  • 之前看電視報導,國外有專門的公司在搞google搜尋網頁排行~他們就會利用你在使用關鍵字搜尋~讓你的公司變成搜尋排行榜的第一順位說!
  • 上星期二才跟Robin見面,他好像蠻有興趣進台灣,您怎麼看?
  • 阿 你跟李彥宏很熟阿?好羨慕~

    其實我對百度並不熟,平常沒有在觀察,大概很難提出什麼有遠見的看法...。

    不過若以搜尋引擎切入的話,想必難度很高。畢竟台灣有9x%網友設Yahoo為首頁。連Google淪落到市佔率10%以下的話,百度大概也不會好到哪去。更何況台灣網友裡的早期使用者普遍對大陸網站抱有排斥心理...。

    我想使用者選擇搜尋引擎並不只是看搜尋技術,還要看其他服務:奇摩拍賣、奇摩新聞、Gmail、Google文件等等。百度在台灣的這塊可以說是0,這並不容易。

    不過也不是沒有機會啦,以百度的技術、資源、名氣,要吸引到第一批使用者應該很容易。但一開始的定位上也許要集中在某個領域上,例如音樂、商品、或什麼特別的搜尋需求。像Google在台灣主要也是吸引學術單位,如常做報告的大學生、寫論文的研究生。站住腳之後再提供其他服務去擴充市佔率。

    至於百度手上有那些彈藥可以切入,哪一塊需求適合百度切入,這就只能問Robin了~XD

    Gamestureplied on 2008/05/18 12:50

  • 參考一下
    http://briian.com/?p=5455
  • 嗯,重灌狂人說得有道理,看來我有被大陸人誤導之嫌阿!

    那個Dale,把這個網址丟給你的大陸朋友看看~

    Gamestureplied on 2008/05/23 23:36

  • 很久之後再回來看,發現格主竟然有這麼長的回應,真是...因為我不是用 pixnet,也無從知道您有回應,真是對不起。
    關於網路服務應該怎樣做,做到什麼程度,這的確是個很值得討論的話題,我仔細的想了想,針對您不同意的地方,想提出一些淺見。
    首先,您說『搜尋引擎的最終目的在於「準確解讀」使用者輸入的詞彙』,這點其實我再同意不過,可是,即便是人與人溝通之間,即使是說一樣的話,寫一樣的文字,都很容易因為生長的環境不同,學校的老師不同,甚至工作的環境影響,而造成對於相同文字的認知差異,尤其中文文字本身的不精確性,更是令我們在數位化資訊時,遇上許多困難。
    如果搜尋引擎真的可以「接近100%」的吐出我們想要的資訊,那搜尋引擎不但無所不知,根本就是網路大神了。其實身邊的一個例子,輸入法,就是一個相近的玩意兒,尤其是台灣人愛用的注音類的輸入法,無論現階段的技術如何進步,增加再多字彙辭典,總是有一定比例的選字誤差,而某注音組合如何對應用詞,一直都是被拿來討論的題目。
    更進一步的想,「精確解讀」的確很重要,但那是我們使用者端的理想,「可能」不是搜尋引擎的真正目的。
    我個人認為,搜尋引擎的最終目的,應該是「現實對應」,使網路的虛擬世界與現實世界產生連結。
    就用您的例子來說吧,「可樂」或許會令人產生對「可口可樂」、「百事可樂」等產品的聯想,但就現實來說,會在日常生活討論可樂的人,就是要比討論以「旅遊」維主題的人,在比例上要來的少許多,跳出可樂旅遊或許您會覺得有些荒謬,但若是這樣想:其一,很多人想要搜尋旅遊資訊。其二,可樂旅遊的廣告常出現在某處,或是口耳相傳有好口碑的特價旅遊。若以上條件滿足,就會有網友開始以「可樂旅遊」當關鍵字,而以搜尋引擎的斷字方式,必然以「可樂,旅遊」的方式做廣義查詢(這是預設),就有非常大的可能造成搜尋「可樂」的關鍵字時,與旅遊相關的「可樂旅遊」容易出現在首頁,甚至前三名的條目了。

    更不用說這背後有 SEO(Search engine optimization) 在背後運作,而以可樂為名的旅遊公司,更是想要沾上可樂這耀人的光啊。

    再來說到 pagerank,我相信「pagerank」是有一定的影響,但同樣的 pagerank 並不是搜尋引擎的全部,若是說要以何種角度看待「張可樂」能夠排在「可口可樂」之前,應該就是我之前所說的「現實對應」吧。

    至於「張可樂」,您真的不知道是誰嗎?他是有名的攝影與文字工作者,名人來著啊,不過成為 GOOGLE 台灣搜尋的第二名,也不排除真的很多人叫「張可樂」,又喜歡用自己的名字當關鍵字在 GOOGLE 查詢囉。

    關於搜尋引擎的技術所使用到 pagerank 的部份,再討論下去可能就會把話題引到純技術層面,剛好,我之前的研究主題跟這千絲萬縷的一點關係,但以技術層面來提出解釋,可能會被所有人排斥,所以就此打住。

    再來就是您提到出現英文網站的結果,我也同樣不認為 Google 有什麼問題,如果我的留言讓您覺得我在說誰好誰壞,可能是我的用詞不夠精確造成您的誤解,真是不好意思,我只是想建議,可以設定關鍵字的範圍,已產生更符合您使用原則的搜尋結果。

    最後您提到以「服務」的角度來看待 Google 等網路服務提供商,所以對大眾使用者來說,一切需要「設定」的東西,都是技術的範疇,這點,我有些想法。

    不是不同意您以「服務」來看待 Google,而是 Google 其實是以服務之名,行營利之實的網路公司,所以我是以「行銷」來看待 Google 的這項搜尋服務,在現實面來說,出現在搜尋引擎的關鍵字都是有一定這方面的考量的,更精確的說,應該是搜尋引擎所使用的技術,是以營利結合為目的的開發,所以純以接受端的使用者來說,這只是看到了一個更大型的廣告宣傳罷了。

    若是 Google 真是「服務」,而它又是純免費的,您不覺得天下真的可能存在這麼好的事,很奇怪嗎?

    基於「使用者付費」的道理,如果您想要得到心中所想的服務,您可能得付費去打造才會出現,而 Google 作為「免費」的資訊搭載傳播媒體,所提供的服務必有一定的侷限性,這樣我覺得還蠻合理的。

    「設定」的選項用或是不用,是個人選擇,不過既然免費的網路服務商肯提供選項給我們設定,我們不妨把所謂的設定看成讓這種行銷工具更接近訂製服務的方式,將它視為服務的一部分而不是因為涉及個人認知上的「技術」範疇就棄而不用,這樣不是能皆大歡喜嗎!
    以上,我雖然說了一大堆,但可能還有一部分的不精確性,且也只是對您的留言的回應,希望您不會誤解。

    再次謝謝您肯花時間跟我討論與回應。
  • 想不到你竟然回了這~麼長的一篇回應...辛苦你了。

    我講一下為什麼我的觀點是怎麼來的好了。關於「正確解讀使用者詞彙」是搜尋引擎的目的,是在「搜尋未來」這本書裡面看來的。書中對整個搜尋產業做一個很完整的整理,也跟Google執行長很熟。雖然不是暢銷書(大家只想看Google,不想看搜尋),但相當值得參考。(btw,我真的不知道張可樂是誰...)

    關於「純免費的服務」這一點,我倒是覺得相當合理。「免費」將是趨勢,Chris Anderson也寫了一夲書「Free」在講這回事。當初Google能勝Yahoo,正是因為他免費。

    也許你會說,Yahoo也免費。但是Yahoo的廣告卻是靠插在搜尋結果裡面,等於是我們付出注意力來點廣告,我們看到廣告會痛苦,這就不是免費的。

    Google會贏,除了技術之外,還因為他們把廣告變成「資訊」。不影響搜尋結果,而廣告內容正是你想要找的,這和Yahoo廣告有本質上的差異。所以這不但不是「使用者付費」、也不是「免費」、而是「提供更好的服務」,同時賺更多錢。

    雖然付費很合理,但是收不到錢,這就是網路世代,就像花錢買歌很合理的數位音樂一樣。若Google哪一天因為營利考量,在搜尋結果插入了讓使用者感覺「這個結果不對勁,是不是有騙人的廣告?」使用者並不會覺得「這是應該的,Google也要賺錢嘛!」而是直接掉頭離去,換服務更好的搜尋引擎了(如果有的話)。

    也謝謝你這麼認真回應阿,多謝。

    Gamestureplied on 2008/05/26 17:19

Comment Permissions: Allow commenting

Leave Comment

*Name/Nickname
E-mail
Personal Website
Comment Title
*Comment
* Private Comment