我在前一篇「黑米不見了!?」裡面,發現在Google怎麼搜「黑米」、搜「HemiDemi」都找不到。不知道是哪一邊的問題。回應裡一則是認為「可能是黑米擋住了Google抓取程式」,另一則認為這是傳說中的Google dance(What's Google dance ?)。事實上是哪一個,我也不知道,但至少到目前為止(05/16 半夜一點半),黑米仍然不知去向。
另外一個比較有趣的回應是,來自我的同班同學Dale,他說:
另外一個比較有趣的回應是,來自我的同班同學Dale,他說:
OK,既然你都說了,就來搜搜看吧!先來看看百度的:「這個問題其實很有趣,大家都認為google比較神,但是卻很難真的知道為什麼它比較神,只知道大家都說好,所以就用了(我本人也是)。
我想文彥一定知道在大陸「百度」遠勝於google,原因很多,我認識的大陸朋友跟我聊了不少,單就「search」就好(不談黑暗面),試想:今天你輸入「可樂」的話,你想查到的是什麼?我想應該是「可口可樂」吧!?文彥可以試試看在這兩者輸入可樂的結果有何差異
我對於背後的運算技術幾乎完全不懂,只是單純的好奇這跟「拉丁文或英文」與「中文」本身的性質有關嗎?語言本身的系統會不會影響search的準確度呢?」
結果依序是可口可樂中國網站、可樂-百度百科、可樂圈、百度照片,相當中規中矩,而且也滿有univsersal search的感覺,有圖片也有名詞解釋。稍微看一下第一頁,至少百度把「可樂」認定是一種「清涼飲料」,這一點是毫無疑問的。
接下來就看看Google吧!
會把Google放在後面當然是有「梗」的。很難想像世界上最強大的搜尋引擎,搜「可樂」竟然是出現康福旅行社-可樂旅遊,這種怎麼看都像廣告的鳥東西竟然出現在第一名!?第二名仍然是旅遊...還是個會跳轉的網頁。第三第四就更加不知所謂了,滾石可樂根本還沒開站,張可樂又是誰阿,莫非他買了關鍵字廣告?
OK,至少在這個關鍵字上,Google敗得相當徹底,徹底到連大陸人都可以用來當作「百度贏過Google」的證明了。真慘哪。
不過我又延伸了一下,試試看在這兩個搜尋引擎打入Oprah Winfrey,看看結果如何。結果是,兩家搜尋引擎都認識Oprah Winfrey,沒有誤解,可是百度從一開始就吐給你中文網站(百度視頻、百度百科等等),而Google則是給你一堆英文網站,第一個是Oprah的官網。
該怎麼解讀呢?Oprah的官網確實是和Oprah關係最密切的網站沒錯,但以一個搜尋Oprah的中國人來說,他可能更想直接看到視頻、或Oprah的生平事蹟。當然,我們也可以解釋成,百度幾乎沒爬到中國以外的地方去,「只不過」是個有十幾億潛在市場的Local search engine而已,Google才是全世界最強。
大陸雖然很多亂七八糟的公司,但是百度看起來並不是屬於這一類。而是和Google一樣,以技術為導向的科技公司。
在「Google與百度」這本書裡,提到李彥宏在第一次融資時,有三家創投表示有意願投資。其中Peninsula Capital的合夥人之一Greg打了通電話給李彥宏之前在Infoseek的CTO,探探他的底。想不到得到的回答是:「李彥宏在搜尋引擎技術方面,在全世界可以排前三名。」
What?前三名?那在他前面的不頂多是Larry跟Sergey了嗎?如果這種人把全副精力投入在「中文搜尋引擎技術」的話,那在這個領域超過Google也是相當合理的一件事了。
不過話說回來,Google和百度也已經越來越難以用「搜尋引擎公司」來理解了。Google推出的一堆Gmail、Blogger、Picasa、reader、Note、Map、earth...數不清的工具,即使你搜尋技術真的不是最強的,我也跑不了。百度似乎要走向社群化,這點我接觸,就不是很清楚了。反正不同公司,各自走不同的路,服務不同的族群,對廣大網民來說,總是好的。
接下來就看看Google吧!
OK,至少在這個關鍵字上,Google敗得相當徹底,徹底到連大陸人都可以用來當作「百度贏過Google」的證明了。真慘哪。
不過我又延伸了一下,試試看在這兩個搜尋引擎打入Oprah Winfrey,看看結果如何。結果是,兩家搜尋引擎都認識Oprah Winfrey,沒有誤解,可是百度從一開始就吐給你中文網站(百度視頻、百度百科等等),而Google則是給你一堆英文網站,第一個是Oprah的官網。
該怎麼解讀呢?Oprah的官網確實是和Oprah關係最密切的網站沒錯,但以一個搜尋Oprah的中國人來說,他可能更想直接看到視頻、或Oprah的生平事蹟。當然,我們也可以解釋成,百度幾乎沒爬到中國以外的地方去,「只不過」是個有十幾億潛在市場的Local search engine而已,Google才是全世界最強。
大陸雖然很多亂七八糟的公司,但是百度看起來並不是屬於這一類。而是和Google一樣,以技術為導向的科技公司。
在「Google與百度」這本書裡,提到李彥宏在第一次融資時,有三家創投表示有意願投資。其中Peninsula Capital的合夥人之一Greg打了通電話給李彥宏之前在Infoseek的CTO,探探他的底。想不到得到的回答是:「李彥宏在搜尋引擎技術方面,在全世界可以排前三名。」
What?前三名?那在他前面的不頂多是Larry跟Sergey了嗎?如果這種人把全副精力投入在「中文搜尋引擎技術」的話,那在這個領域超過Google也是相當合理的一件事了。
不過話說回來,Google和百度也已經越來越難以用「搜尋引擎公司」來理解了。Google推出的一堆Gmail、Blogger、Picasa、reader、Note、Map、earth...數不清的工具,即使你搜尋技術真的不是最強的,我也跑不了。百度似乎要走向社群化,這點我接觸,就不是很清楚了。反正不同公司,各自走不同的路,服務不同的族群,對廣大網民來說,總是好的。
提供一段影片,讓大家多認識一下李彥宏吧!












Recommend to Front page



你知道,你不知道我......
你知道你,不知道我.....
如果逗號位置不同的意思就會不同,這個是Google沒有特別去處理的百度在這方面做的就比較好
但是Google比較紅呀~~它已經變大神了~
這個年頭Content沒有被Google Search到,已經不算是Google的錯了
不少網站/公司還花錢特別對Google作SEO 想辦法排到前面去
可能這種中文搜尋怪現像會造成另一種變像的SEO需求~
不過在資料廣度夠,利用多加幾個關鍵字來加強檢準也有不錯的效率下,我到是沒有用其他搜尋引擎的意念。
不過對很多人來說可能就不是這樣,
在這情形下google的這個服務http://briian.com/?p=5370可能要緩緩了。
百度是很好的搜索引擎,但很可惜很多台灣的網站,百度是不會收錄的。
如果拿雅虎奇摩來跟google來比較,google的優點還是比較多的,比如說google最快可以在幾分鐘之內搜索到網頁並收錄,雅虎奇摩需要一天以上,通常是三天左右。
雅虎奇摩的搜索排名很容易變動劇烈,但變動的卻又不合邏輯,檢索日期甚至有時會倒退,比如說,明明流量較大的頁面,卻無法得到較好的排名,或是排上去之後,在流量未減的狀況下,排名卻莫名直往下掉,而有些流量未增卻又往上跑。google在程式的運作上則精準許多,合乎邏輯,但可能因為完全由程式控制,所以也會出現極少數奇怪的狀況。
雅虎奇摩的排名疑似有人員手動調整,以避免程式演算的僵化性。
雅虎奇摩的排名非常自私,跟雅虎奇摩有關的網頁可以享受較好的待遇,比如說無名的blog、日雅虎的網站免費空間等等,可以輕易獲得較好的排名。
還有,文中使用「可樂」為例,似乎不甚妥當,雖然關鍵字的下法,因為沒有辦法很好地建立統一的觀念,所以很難清楚的被分類,雖然以「可樂」來說,我的確是會聯想到「可口可樂」,但其實可樂在中文中還可以產生其他聯想,例如還可以想到「可樂果」等等,所以應該算是表意模糊的詞,所以為了要更精確的搜尋到目標,使用「可口可樂」,甚至「coke」、「coca-cola」之類的關鍵字,應該能更加精確。
刻意的適用模糊性的關鍵字比較,因為認知不一定相同,很容易在討論中失去立場。
還有出現英文網站的問題,你也可以設定讓 google 只吐中文的網站啊,好像要這樣比好像才有意義吧。
http://briian.com/?p=5455
關於網路服務應該怎樣做,做到什麼程度,這的確是個很值得討論的話題,我仔細的想了想,針對您不同意的地方,想提出一些淺見。
首先,您說『搜尋引擎的最終目的在於「準確解讀」使用者輸入的詞彙』,這點其實我再同意不過,可是,即便是人與人溝通之間,即使是說一樣的話,寫一樣的文字,都很容易因為生長的環境不同,學校的老師不同,甚至工作的環境影響,而造成對於相同文字的認知差異,尤其中文文字本身的不精確性,更是令我們在數位化資訊時,遇上許多困難。
如果搜尋引擎真的可以「接近100%」的吐出我們想要的資訊,那搜尋引擎不但無所不知,根本就是網路大神了。其實身邊的一個例子,輸入法,就是一個相近的玩意兒,尤其是台灣人愛用的注音類的輸入法,無論現階段的技術如何進步,增加再多字彙辭典,總是有一定比例的選字誤差,而某注音組合如何對應用詞,一直都是被拿來討論的題目。
更進一步的想,「精確解讀」的確很重要,但那是我們使用者端的理想,「可能」不是搜尋引擎的真正目的。
我個人認為,搜尋引擎的最終目的,應該是「現實對應」,使網路的虛擬世界與現實世界產生連結。
就用您的例子來說吧,「可樂」或許會令人產生對「可口可樂」、「百事可樂」等產品的聯想,但就現實來說,會在日常生活討論可樂的人,就是要比討論以「旅遊」維主題的人,在比例上要來的少許多,跳出可樂旅遊或許您會覺得有些荒謬,但若是這樣想:其一,很多人想要搜尋旅遊資訊。其二,可樂旅遊的廣告常出現在某處,或是口耳相傳有好口碑的特價旅遊。若以上條件滿足,就會有網友開始以「可樂旅遊」當關鍵字,而以搜尋引擎的斷字方式,必然以「可樂,旅遊」的方式做廣義查詢(這是預設),就有非常大的可能造成搜尋「可樂」的關鍵字時,與旅遊相關的「可樂旅遊」容易出現在首頁,甚至前三名的條目了。
更不用說這背後有 SEO(Search engine optimization) 在背後運作,而以可樂為名的旅遊公司,更是想要沾上可樂這耀人的光啊。
再來說到 pagerank,我相信「pagerank」是有一定的影響,但同樣的 pagerank 並不是搜尋引擎的全部,若是說要以何種角度看待「張可樂」能夠排在「可口可樂」之前,應該就是我之前所說的「現實對應」吧。
至於「張可樂」,您真的不知道是誰嗎?他是有名的攝影與文字工作者,名人來著啊,不過成為 GOOGLE 台灣搜尋的第二名,也不排除真的很多人叫「張可樂」,又喜歡用自己的名字當關鍵字在 GOOGLE 查詢囉。
關於搜尋引擎的技術所使用到 pagerank 的部份,再討論下去可能就會把話題引到純技術層面,剛好,我之前的研究主題跟這千絲萬縷的一點關係,但以技術層面來提出解釋,可能會被所有人排斥,所以就此打住。
再來就是您提到出現英文網站的結果,我也同樣不認為 Google 有什麼問題,如果我的留言讓您覺得我在說誰好誰壞,可能是我的用詞不夠精確造成您的誤解,真是不好意思,我只是想建議,可以設定關鍵字的範圍,已產生更符合您使用原則的搜尋結果。
最後您提到以「服務」的角度來看待 Google 等網路服務提供商,所以對大眾使用者來說,一切需要「設定」的東西,都是技術的範疇,這點,我有些想法。
不是不同意您以「服務」來看待 Google,而是 Google 其實是以服務之名,行營利之實的網路公司,所以我是以「行銷」來看待 Google 的這項搜尋服務,在現實面來說,出現在搜尋引擎的關鍵字都是有一定這方面的考量的,更精確的說,應該是搜尋引擎所使用的技術,是以營利結合為目的的開發,所以純以接受端的使用者來說,這只是看到了一個更大型的廣告宣傳罷了。
若是 Google 真是「服務」,而它又是純免費的,您不覺得天下真的可能存在這麼好的事,很奇怪嗎?
基於「使用者付費」的道理,如果您想要得到心中所想的服務,您可能得付費去打造才會出現,而 Google 作為「免費」的資訊搭載傳播媒體,所提供的服務必有一定的侷限性,這樣我覺得還蠻合理的。
「設定」的選項用或是不用,是個人選擇,不過既然免費的網路服務商肯提供選項給我們設定,我們不妨把所謂的設定看成讓這種行銷工具更接近訂製服務的方式,將它視為服務的一部分而不是因為涉及個人認知上的「技術」範疇就棄而不用,這樣不是能皆大歡喜嗎!
以上,我雖然說了一大堆,但可能還有一部分的不精確性,且也只是對您的留言的回應,希望您不會誤解。
再次謝謝您肯花時間跟我討論與回應。
Comment Permissions: Allow commenting