最新欄目文章加載中。。。
在數(shù)據(jù)的洪流中決策
????作者:斯圖亞特?布朗(Stuart F. Brown) ????工業(yè)數(shù)據(jù)庫里往往隱藏著沉沒的寶藏。這里有一條引領(lǐng)制藥公司和其它人通向?qū)毑氐慕輳健?/em> ????人們的工作往往被淹沒在大量的數(shù)據(jù)資料中,但是他們又的確需要數(shù)據(jù)。如今,計算機使得制藥,生產(chǎn)電腦芯片,乃至石油勘探這些行業(yè)匯集大量信息變得更加容易。對于決定在哪里開鑿油井、在芯片制造過程中怎樣糾正一個代價高昂的小錯誤,或者在數(shù)不勝數(shù)的化合物中決定將哪一種作為重量級新藥,這些數(shù)據(jù)將是至關(guān)重要的。但是,回報卻只屬于那些在如海浪般潮涌而來的原始數(shù)據(jù)資料中撒網(wǎng)捕捉到機遇之魚的人。 ????讓我們來看看以下叁家公司所面臨的數(shù)據(jù)篩選的挑戰(zhàn)吧: ????位于印第安納波利斯的禮來公司(Eli Lilly & Co.)用一種叫作組合化學(xué)的自動化程序在幾天時間內(nèi)對少量但又確實有用的化合物進行幾千次的合成。然后這些化合物被注入到下一個叫作高容篩選的程序中,這是一個觀察它們?nèi)绾闻c生物“目標”物質(zhì)發(fā)生反應(yīng)的程序。而隱匿于大量反應(yīng)結(jié)果中的則很有可能是新藥種的候選成份。 ????阿納達科石油公司(Anadarko Petroleum)是休斯頓一家石油勘探及生產(chǎn)商。公司的地球化學(xué)家和工程師們根據(jù)大量的地震及其它方面的數(shù)據(jù)來預(yù)測儲量可觀的石油和天然氣的地下位置。那麼他們應(yīng)該怎樣指點耗資巨大的鉆井隊伍呢?答案就在那些數(shù)據(jù)中。 ????位于達拉斯的德州儀器公司(Texas Instruments)科比芯片加工廠開發(fā)芯片制造工藝及生產(chǎn)微處理器,僅僅是其中裝配硅晶片一環(huán)就要耗時數(shù)周并通過至少 400 余道精密生產(chǎn)工序。大量的傳感器監(jiān)控著生產(chǎn)儀器,并且隨著每一片晶片的生產(chǎn)同時要收集至少 14 萬條相關(guān)信息。這些大量的數(shù)據(jù)中有些能對生產(chǎn)過程中將要出現(xiàn)的錯誤發(fā)出警告。而對一個錯誤的提前預(yù)警,通常就能使其在生產(chǎn)出不合格的芯片前及時進行補救。 ????一種新的軟件構(gòu)思正開始幫助這些公司在尋找隱藏于數(shù)據(jù)海洋中的模式和內(nèi)涵上減少時間和金錢的投入?;ヂ?lián)網(wǎng)專家埃斯特?戴森(Esther Dyson)將這種方式比作是“戴上不同顏色的眼鏡或者是濾光器來觀察事物?!边@種方法最早是克里斯多佛?阿爾伯格(Christopher Ahlberg)在一篇博士論文中提出來的,這位 32 歲的瑞士人是馬薩諸塞州薩默維爾市星火軟件公司(Spotfire)的創(chuàng)始人。而他創(chuàng)造的對不同數(shù)據(jù)進行探測分析的部分靈感則和在網(wǎng)上用瀏覽器沖浪極為相似。他還有一個目標,就是要用醒目的視覺顯示器通過僅僅是普通人就能很快直觀掌握的方法來演示數(shù)據(jù)結(jié)果?!皵?shù)據(jù)庫是圖表法將要攻克的最后領(lǐng)域,”阿爾伯格說。 ????大多數(shù)公司所依賴的數(shù)據(jù)庫并不是依據(jù)使用簡便的原則建立的。它們大多數(shù)都使用一種稱作結(jié)構(gòu)化詢問語言的接入方式,簡稱 SQL,這種語言非常難掌握,以致于許多機構(gòu)都要用高薪聘請專業(yè)人士來與他們的數(shù)據(jù)庫進行對話。而面對毫無想象力的 SQL,你隨便問一個問題就會輕易得到幾百萬條答案──大量毫無意義的結(jié)果。更糟糕的是,這些數(shù)據(jù)庫根本就不是為那些通常想一探究竟的使用者而建的。 ????星火公司的軟件首次將“數(shù)據(jù)視圖”和功能強大的靈活查詢結(jié)合在一起。如著名的 DecisionSite 軟件,其價格不菲──安裝這一軟件起價 10 萬美元。但這并未使許多不同行業(yè)的客戶望而卻步,并且其銷量已突破 1.6 萬件。產(chǎn)品面市四年來,這家私營軟件公司的年銷售額據(jù)估計已達 3,000 萬美元(阿爾伯格說,雖然這項業(yè)務(wù)還沒有開始贏利,但是已經(jīng)非?!敖咏绷耍?。最近,IBM 的生命科學(xué)部將其營銷觸角伸向了這項產(chǎn)品:針對那些希望加速研發(fā)工作的制藥公司,這位藍色巨人正在試圖將數(shù)據(jù)管理軟件與星火公司的工具融為一體。 ????星火公司軟件的神奇之處就在于它使用戶在對來源不同的數(shù)據(jù)進行假定分析比較時只需用鼠標在電腦屏幕上滑動。實際上,它為數(shù)據(jù)捕撈者提供了可隨意調(diào)整的漁網(wǎng)。換句話說,他們能在不超過叁英寸的距離內(nèi)搜尋到藏在水底的魚,然后,稍加判斷,就能將鳳尾魚和沙丁魚區(qū)別開來。而結(jié)果就會呈現(xiàn)出醒目的色彩,并以條狀、扇形、發(fā)散形示意圖,甚至是地圖的形式顯示出來。 ????星火公司四年前開始批量生產(chǎn)軟件時,起初主要是針對制藥業(yè),在這一行業(yè)中數(shù)據(jù)的規(guī)模激增。其中一位較早的采用者是禮來公司生產(chǎn)及供應(yīng)服務(wù)部的信息官謝爾登?奧特(Sheldon Ort)。目前,奧特的公司在世界各地有 1,500 名科學(xué)家離不開這個軟件。“我們主要用它來幫助決策,”奧特說?!耙驗樗哂斜磉_不同來源的信息的能力并且能夠用互動的方式改變你的視野,所以它能幫助我們尋找到特殊的分子并幫我們決定是否還要對其進行進一步的測試?!?/p> ????藥品開發(fā)這一行有句話叫做“失敗應(yīng)趕早?!蹦鞘且驗橐环N典型的新藥從通過聯(lián)邦食品及藥物管理局(FDA)的批準并上市大約要花費五億美元。這樣高的費用迫使禮來這樣的公司盡可能早地發(fā)現(xiàn)那些可能使病人中毒或是引起其它不良副作用的化合物,從而在對其投入更多的研究資金之前將其排除。 ????而當(dāng)他們研究新的化合物時,制劑師也許想了解一些問題,例如,這些物質(zhì)是否能穿越人體的腦血栓?存在的毒性是什麼?它們的化學(xué)結(jié)構(gòu)是什麼?人體多快才能吸收它們以及它們在血液里能持續(xù)多長時間?當(dāng)它們遇到其它成份的藥劑時會如何反應(yīng)?像這種關(guān)鍵性因素的問題可能會有 20 條或者更多。而如果像過去那樣將這些信息存貯在不同的數(shù)據(jù)庫里,那麼將它們進行對比則是一項耗時巨大的工程。 ????使用星火公司的軟件,研究人員可以不用建立多個完整的查詢序列。只要來回拖動一下鼠標,用戶實際上就可以連續(xù)登陸一系列的查詢數(shù)據(jù)庫,而結(jié)果也會通過圖形顯現(xiàn)在屏幕上。禮來公司用這種軟件來對那些在不同站點通過計算機網(wǎng)絡(luò)連接在一起的研究人員之間的會議工作進行管理。當(dāng)發(fā)言人在他或她的屏幕上移動鼠標的時候,每個人都能看到其種類、集散區(qū)域、外露層、空隙處、 ?,F(xiàn)象,以及數(shù)據(jù)庫用戶尋找的其它貴重金屬的統(tǒng)計數(shù)據(jù)。同時大家可以立刻共同探討并做出決策。奧特現(xiàn)在正試著以此對禮來公司的供應(yīng)鏈進行更有效率的管理。 ????阿爾伯格說直到阿納達科石油公司打電話給他們時,他才想到將軟件應(yīng)用到能源領(lǐng)域。“我過去并沒有意識到藥品開發(fā)和石油及天然氣行業(yè)有什麼相似之處。這時我意識到這和化學(xué)結(jié)構(gòu)庫一樣,石油及天然氣行業(yè)需要的則是地圖──地理學(xué)地圖。星火公司和加利福尼亞州瑞得蘭市的著名地理信息系統(tǒng)供應(yīng)商 ESRI 結(jié)成了合作聯(lián)盟。而最后的結(jié)果現(xiàn)在已經(jīng)轉(zhuǎn)化為供阿納達科石油公司員工用于策劃油田開采的 DecisionSite 軟件,并配以可視地圖。 ????阿納達科石油公司的國際勘探部經(jīng)理羅恩?貝恩(Ron Bain)告訴我們:“我們的地理學(xué)家和工程師需要將大量的數(shù)據(jù)庫信息以 Excel 電子表格的方式讀出,可以想象,在若干個 Excel 電子表格上對 1,000 個數(shù)據(jù)點進行比較是一件非常困難的事情。而采用星火公司的軟件就好像用 Excel 表格分析類固醇,它能同時完成所有交叉測繪工作,以尋找石油的儲藏地點?!?/p> ????隨著原油價格上漲,阿納達科石油公司每五個小時就要在世界上某個地方開采一口新井。為了決定這些油井的位置,公司的地理學(xué)家需要查閱許多數(shù)據(jù)庫,包括磁場數(shù)據(jù)、重力數(shù)據(jù)、現(xiàn)有油井中的傳感器傳輸來的信息,以及對地表巖石結(jié)構(gòu)進行地震勘測的結(jié)果。做這項工作,磁盤驅(qū)動器需要很大空間。例如,對墨西哥海灣一塊九平方英里的海底的勘測結(jié)果就包括 5 到 6 GB(千兆字節(jié))的數(shù)據(jù)資料;而在阿納達科石油公司多達 20,000 GB 的存檔資料庫里卻有成千上萬這樣的數(shù)據(jù)。 ????而星火公司的承諾是“簡化決策程序,”貝恩說?!叭绻麤]有它,我可能要處理大量的信息,而它則能使我變得非常聰明或者說是非常成功。它的理念是要以經(jīng)濟的方法找到和生產(chǎn)石油。我們喜歡說我們在有石油的地方開采,而不是在可能有石油的地方。這些 DecisionSite 軟件能幫助我們更快地找到答案。” ????芯片產(chǎn)業(yè)耗資巨大──每一個新廠的投資至少需要 10 億美元──而且當(dāng)產(chǎn)品進入復(fù)雜并且高度敏感的制造過程中時還要追加大量的投入。而對于將工廠的合格芯片產(chǎn)量保持在一個贏利水平而言,在那些細小錯誤鑄成大錯前發(fā)現(xiàn)它們是至關(guān)重要的。芯片制造者依靠程序監(jiān)控傳感器、功能強大的檢測裝置、統(tǒng)計分析和專業(yè)軟件來發(fā)現(xiàn)錯誤在哪里及如何檢測并將其避免。 ????典型的問題包括破壞芯片成型及晶片蝕刻的污染物,以及光刻程序自身的錯誤。德州儀器公司芯片上的某些部件只有 0.13 微米那麼大,因此即使是最微小范圍內(nèi)的變化都有可能招致災(zāi)難性的事故。至少能疊加 25 層的連續(xù)電路模式排列也很重要;精度不夠很有可能就意味著糟糕的線路聯(lián)通。 ????為了避免用這種困難的方法發(fā)現(xiàn)錯誤──待數(shù)周后發(fā)現(xiàn)它們時再想挽救芯片卻為時已晚──德州儀器公司收集了大量正在生產(chǎn)的晶片的數(shù)據(jù)資料。而訣竅就是要迅速弄懂信息的含義?!拔覀兛梢远〞r收到所有晶片進入到每一個生產(chǎn)環(huán)節(jié)時的數(shù)據(jù)資料,”生產(chǎn)及產(chǎn)品技術(shù)主管喬?勒博維茨(Joe Lebowitz)說,“但是它卻不能清楚直觀地顯示出 14 萬個或者更多的參數(shù)中哪一個可能是重要的?!?/p> ????星火軟件供應(yīng)商提供了許多統(tǒng)計數(shù)據(jù)分析程序,可以有助于滿足半導(dǎo)體行業(yè)篩選信息的需求。德州儀器公司使用了他們的許多軟件,而且仍在尋覓找到隱藏在所有噪音里的信號的捷徑。而在一年中,公司有大半年在評估并參與到星火公司針對芯片制造商的需求而專門設(shè)計的 DecisionSite 軟件的開發(fā)中去。勒博維茨對此印象極其深刻?!拔蚁矚g把它比作一個魔方,你需要從不同的側(cè)面觀察從而找到解決方案,”他說?!靶腔疖浖梢允刮业墓こ處焸儚母旧蠈?shù)據(jù)資料掌握在自己手里,輕松快捷地將其顛來倒去從不同方面進行研究。這是一個巨大的進步。” ????勒博維茨在他的工作領(lǐng)域與制藥研究人員的工作之間看到了一種非常接近的相似性。“我對晶片最想做的事和制劑師對潛在的化合物想做的事情一樣,”他解釋道?!拔蚁朐谠偻度氤汕先f的美元之前盡早找出錯誤的因素并將其清除出去?!彪y道有哪家公司不是這麼想嗎? ????譯者:郎雪月 相關(guān)稿件
|
500強情報中心
|
深入財富中文網(wǎng)
|