第七十九章現場演示
如果出现文字缺失,格式混乱请取消转码/退出阅读模式
海量小说,在【小狐看書】
第七十九章“現場演示?”周青山哈哈大笑起來,撇撇嘴說道:“就算我是中文系的,也知道一款輸入法軟件的開發週期需要很久。你們公司成立多長時間了?有一個月嗎?侯世達你當自己是主角了吧?一晚上就能寫出個世界第一的瀏覽器程序來,哈哈哈哈!”侯世達淡淡的看了他一眼,心裡其實很奇怪。按說帝郵在國內也算排的上號的好大學了,能考上的不可能智商欠費,但怎麼學生會里扎堆的都是這麼一類人呢?事兒媽、小心眼、沒有自知之明,表面上看好像會做人,其實反而讓人打心眼裡討厭。
這周青山按說造型不差,放電視劇裡起碼都能活十分鐘。怎麼一張嘴,就讓人有種他欠揍的衝動…
“哦,週會長還知道自己是中文系的啊?”侯世達呵呵輕笑,搖頭道:“那就請你閉嘴,我們軟件專業的問題,你算老幾?”
“你…”周青山何曾被人這麼搶白過,當真是差點沒被氣的翻白眼來。不過看周圍同學們的眼神,也都是差不多一樣的輕視。
侯世達失望的搖頭道:“你什麼?以你的智商,我很難和你解釋什麼叫做測試版的。”
“哈哈哈哈——”周圍傳來一陣笑聲,眾人心中也覺得周青山和侯世達這次鋒真是找
,他一個文科生和人家專業程序員起膩,真不知道腦袋怎麼想的。
周青山被氣的臉一陣發白,恨恨的點頭道:“好,那我就看你怎麼把牛皮吹破。”侯世達轉過身來,不再把注意力放在他的身上,而是走到了木架旁邊。他掀開木架上的第一頁紙,第二頁紙上面畫了一個樹狀圖,就聽他說道。
“在展示我們的內部開發測試版之前,我先簡要的說一下六耳輸入法的實現原理吧。”
“這是一幅我們人類負責語言思維的決策樹狀圖,我認為人類的語言並非只是一種信息傳遞協議,更是認知世界的重要工具。輸入法若想理解人類的‘語法’,首先得了解人類思考的兩大部分——知識和智能。可以說人類所謂的智慧,就是由這兩部分構成的。而一直以來的輸入法,對數據的處理方式,都是用計算機理解的二維表格數據庫模式。正是這種和人類思維完全不同的數據處理方式,導致了現在的數據爆炸問題。”
…
侯世達不斷的將木架上的白紙掀開,從人類思維的模式開始侃侃而談。
別看未來所謂的智能輸入法好像遍地開花,於是就覺得這東西非常簡單。恰恰相反,識別率越高的輸入法對技術要求就越高。尤其是侯世達對六耳輸入法並不滿足於實現整句輸入為止,而是必須在整句輸入的前提下能夠實現至少95%的首次輸入正確率。
如果只是打出拼音來,然後判斷每個詞的組成,最後用幾個詞語組成一句不通的句子,那用微軟的智能abc就能做到,用戶不過多敲打幾下空格而已。但要做到整句輸入,就是要讓用戶一次輸入整個句子,一氣呵成。讓後面的詞語能夠據前面的內容、語義進行自動關聯,這種對數據的要求,是傳統表型數據無法提供的。
人類對語言的處理過程,不是二維結構,而是一種空間座標形式存在的。要想讓計算機實現人類的“聯想”能力,就要讓數據像人類處理知識一樣,具有進行空間排列。若想能夠對數據進行分析、歸類和查找,就要知道人類的腦海中知識是如何存在的?歸結底,是一個個神經元中的電脈衝。而神經元肯定不是二維結構,而是所有腦細胞組成的三維結構。
一個神經元被活之後,會向它附近所有的神經元發
一束電脈衝。一個神經元發
的電脈衝不足以
活另一個神經元,但如果一個神經元在一個單位時間內有多個電脈衝抵達,那就會被
活,這就是人類思考的過程。
智能輸入法中用戶輸入的每一個詞,都會向後面的其他詞語添加一個閾值。當後面某個詞的閾值突破臨界點之後,就可以進入備選的範圍之內。而這個備選數據庫,就是解決信息爆炸問題的關鍵。因為它是一個三維矩陣形式的數據庫,通過knn近鄰算法,就能實現非常高的選擇準確率。
尤其是通過這種算法,還能對詞庫裡沒有出現過的新詞,經過幾次訓練之後就實現機器學習。這一點對無法窮盡人類詞語的詞庫來說,意義特別重大。
然而這些侯世達的同學們,誰也沒有想過原來數據還能有三維的組織形式!這對他們來說,不啻是打開了一扇新天地的大門!
不僅是下面的同學們聽的目眩神、如痴如醉,就連周青山身邊幾個高材生,聽的都目光炯炯有神。
或者應該說,正因為他們都是學校裡的高材生,對侯世達說的這些理論上的東西,理解的反而更加深入!
雖然侯世達說的真就是“泛泛而談”並沒有對這些原理在軟件上的應用方式多說。但在場的所有專業同學,都能在冥冥之中覺到,這些知識將開啟一個新的時代!
哪怕是平常上課的時候,再怎麼不老實的學生,這時候都在全神貫注的聽講。如果在場的有他們的專業課老師,非得被氣的吐血不可。這幫小兔崽子們,上教授、講師的課,該睡覺睡覺、該講悄悄話就講悄悄話,何曾這麼用心過?
但此時這裡不是寬敞明亮的大教室,而是有些昏暗、溼的食堂,上面講課的不過一個和他們一樣的學生,卻偏偏聽的津津有味。
這可不是咄咄怪事嗎?
“好了,關於我這個項目的大概原理,今天就講到這裡。下面請同學們體驗一下,我們六耳輸入法的測試版。”侯世達講了半天,將木架上的白紙翻到了最後一頁。這頁紙上什麼內容也沒有,但見他走到面前的第一排餐桌上,打開了桌子上的投影機。
一道七彩的光束打在了紙上,原來這最後一頁竟然被當做了投影幕牆使用。投影機將畫面投在白紙上,上面分明是一臺計算機的桌面,桌面上此時已經打開了一個界面相當醜陋的軟件。
“侯同學,能問一下你們的軟件目前完成度達到了多少嗎?”食堂裡有人舉手提問道。
“大概55%吧,我們最近正在加快開發進度,相信再有幾周時間就能完成這款輸入法的開發了。”
“主要技術問題已經都解決了?”侯世達走到與投影機連接的電腦前,頭也不抬的邊作電腦,邊說道:“是的,已經解決了80%的關鍵技術節點,目前最大的工作內容是建立初始詞庫。”
“由於我們的初始詞庫還在修正中,所以目前的整句準確率不太高,只有73%左右。”
“超過70%,這是半成品?”這次就連班長寒武都忍不住動容了,他能當上班長當然不可能不學無術。別說是超過70%的識別率,目前市場上連一款超過50%的都沒有!就這個識別率,推出市場都已經沒有問題了。
侯世達無辜的點點頭,笑道:“我們的目標是讓拼音輸入的準確率達到95%,否則可算不上是革命的進步。”食堂裡隨著他這句話陷入了短暫的安靜,“革命
的進步”啊,這是多少軟件專業學生的夢想?學生們都是有些
漫幻想的,除了錢,誰不想讓自己在這個世界上留下一段傳說?而一款革命
進步的軟件,足以讓一個人的名字,留在計算機歷史上了。
“誰能借我一本書?隨便什麼書都行。”
“用我的吧。”旁邊有同學遞過來一本書,侯世達順手翻開一頁,看也沒看就照著上面的某一段敲打起鍵盤來。
“當他走到門口的時候,公主叫住了他,恩萊科以為公主發了善心赦免了他的罪行,哪裡知道公主只是對他說道:‘恩萊科你要注意,千萬別出你男人的嗓音,那是你唯一會
出馬腳的地方,千萬別再出醜啊,如果你再出醜,你的人生可就完蛋了,好自為之吧!’”咦,好奇怪的內容。侯世達看著這段文字有點眼
,但想不起來究竟在哪裡看到過了。
不過這段文字基本沒有什麼生僻字,前後文的邏輯也比較簡單,侯世達幾乎沒有進行過第二次選擇,輕而易舉的就把它打了出來。
和智能abc不同的那種使用體驗,讓在場的所有人都看直了眼。沒有不斷敲打空格,也不用費神去選詞。只要侯世達的拼音打出來,輸入框下面就不斷地刷新出一整句話來。就算前面有的詞語選擇錯誤,但當一整句話輸入完畢,前面的錯誤自己就已經進行了更改。
這種宛若行雲水的
覺,輕而易舉的就征服了在場所有人的心。