首頁>資訊 >
26鍵VS九宮格,中文輸入法45年發(fā)展史 2022-04-19 12:46:26  來源:36氪

01 五筆是怎么來的

1978年12月,全國漢字編碼學(xué)術(shù)交流會在青島召開。

這次「青島會議」聚集了來自中科院和各地高校的眾多學(xué)者,他們討論的問題在如今看來難以想象:

如何把漢字輸入電腦?

在如今這個搜狗訊飛橫行天下,年輕人扣字速度快到飛起的年代,很難想象,在七八十年代的中國,中文輸入成了一項「卡脖子」的技術(shù)。

原因也很簡單,漢字實在是太多了。

1980年發(fā)布的國標GB2312字集里,包括了6763個漢字,而2005年發(fā)布的國標GB18030-2005字集收錄了高達70244個漢字。

國標GB18030字符集

而且和西文字母不同,漢字并沒有一個類似「ABCD」之類的排序方法。

如何把多而無序的漢字和鍵盤上的按鍵一一對應(yīng),在當時并沒有一個現(xiàn)成的解法。這也使得漢字在信息處理,尤其是信息輸入上,遠遠落后于西方國家。

1984年洛杉磯奧運會,當法新社記者看到中國記者還在手寫新聞發(fā)稿,直接陰陽怪氣了一番:7000名記者,只有中國人還在用手寫!

當時學(xué)界不乏「漢字落后論」的聲音,有些極端學(xué)者甚至認為在計算機時代,漢語拼音文字將取代方塊字,成為中文的出路。

「漢字拼音化」,「拼音代替漢字」甚至 「一語雙文」的論調(diào)層出不窮。有些地方的學(xué)校甚至出現(xiàn)了「語文全拼音化」教學(xué)。

站在計算機技術(shù)起飛的前夜,漢字輸入問題必須得到解決。

會上眾多專家教授都提出了不同的意見,主流的看法是:開發(fā)一款專門為漢字輸入而設(shè)計的鍵盤。

當時的漢字專用鍵盤有三種方案,一種是整字大鍵盤。

也就是把幾千個漢字,按照部首分區(qū),放在一塊像桌子一樣大的鍵盤上,哪里要用點哪里,so easy!

如果一塊鍵盤不夠,還可以放第二塊,第三塊。

這個方案優(yōu)點很突出,沒有學(xué)習(xí)成本,很直接。缺點也很突出,除了簡單直接以外都是缺點:不能盲打,速度極慢,每分鐘能輸入10個漢字就是極限了。而且一塊鍵盤造價幾千塊,設(shè)備大,成本高,不實用。

第二個方案是仿照日本人設(shè)計「主輔鍵鍵盤」。

這個方案,由一塊主鍵盤和一塊輔鍵盤構(gòu)成。輔鍵盤負責(zé)定分區(qū),主鍵盤按對應(yīng)的按鍵就能輸入分區(qū)中特定的漢字。

可以看出,這個方案這是對上面那個的一個改進,減小了設(shè)備體積,可以雙手打字,速度也快了很多。

但造成了一個巨大的bug:打字員需要記住每個漢字處在哪個分區(qū),排序在哪個位置。

哪怕只有幾千個漢字,都是巨大的學(xué)習(xí)成本。這個方案,基本上沒有普及的可能性。

第三個方案,則是漢字激光照排之父王選院士提出的256鍵「中鍵盤」方案。

王選

這個方案把所有漢字拆成了1000多個筆畫和部首,把它們放在256個按鍵上。只要按照結(jié)構(gòu)組合這些「零部件」,就能像拼樂高一樣拼出想要的漢字。

中鍵盤第一次用到了「拆字」的方法,也就是漢字編碼類型中的「形碼」。

后來的五筆、鄭碼以及此前朱邦復(fù)在1976年所創(chuàng)制的倉頡輸入法,使用的都是「形碼」。

倉頡輸入法

相比前兩套系統(tǒng),中鍵盤方案顯然是先進了很多,但還遠遠稱不上完美。

畢竟英文的QWERTY鍵盤,只有26個字母鍵,鍵位少,夠輕便,而且已經(jīng)在國際上通用了。如果可以,誰不想直接用現(xiàn)成的東西啊,奈何漢字確實太特殊了。

就在青島會議召開的同一年,河南南陽科委的王永民也加入了漢字輸入法開發(fā)的工作。

王永民

和當時的主流想法類似,他一開始也希望制造一款專屬于漢字的鍵盤。

為了實現(xiàn)這一目標,王永民把《現(xiàn)代漢語詞典》中,12000多個漢字逐一分解,進行分類統(tǒng)計,歸納出了600多個組字單位,王永民將它們命名為字根。并且根據(jù)出現(xiàn)頻度,選出了其中最常用的125種。

在他的努力下,他把中文專用鍵盤的鍵位從256個,壓到了188個,又壓到了62個。到1982年,王永民開發(fā)出了36鍵方案。

而且這一切都是在沒有計算機,純?nèi)斯そy(tǒng)計的情況下開發(fā)出來的。

這時,擺在他面前的,有兩條路。

一條是推廣36鍵方案。這套方案在1982年已經(jīng)上機成功,作為當時最先進的方案,其實已經(jīng)有普 及的可能性了。

另一條路則是回頭繼續(xù)研究,壓縮鍵位,壓到完全適配26鍵的QWERTY鍵盤。

要知道,鍵位壓縮得越少,重碼,也就是一組按鍵對應(yīng)的不同文字就會越多,而選字會極大影響效率,到了這一步,再往下壓縮已經(jīng)很難了。

但是王永民選擇了更難的一條路。

為了降低重碼,經(jīng)過將近一年的研究,王永民發(fā)明了「末筆字型識別碼」,將每個字最后一個筆畫編碼定位,將重碼率降低了一個數(shù)量級。

1983年8月28日,王永民發(fā)明的「五筆字型」宣告誕生。

五筆的厲害之處,首先就在于「快」。

因為引入了「橫豎撇捺折」五種筆畫的分區(qū),使得用戶最多只需要按5次按鍵,就能鎖定唯一的漢字。

沒有重碼,意味著用戶不再需要挑選想要的字詞,經(jīng)過練習(xí),甚至可以實現(xiàn)雙盲輸入,也就是不看鍵盤也不看屏幕打字。

而且相比大鍵盤和中鍵盤,五筆的鍵位少,學(xué)習(xí)成本更低。

許多80后可能還會背「五筆口訣」,什么「王旁青頭兼五一, 土士二干十寸雨」。而熟練的五筆用戶甚至不需要這些,依靠肌肉記憶就能輸入。

其次就是五筆完美兼容QWERTY鍵盤,不需要專門再開發(fā)新的硬件。

在五筆發(fā)布之初,因為不需要專用鍵盤,甚至被學(xué)界認為是「崇洋媚外」,「食古不化」,但市場和用戶是用腳投票的。

1984年,國家科委和國防科工委先后發(fā)布「紅頭文件」向全國全軍推廣五筆字型。

1986年,五筆字型經(jīng)由外交部進入聯(lián)合國 ,也在同年以數(shù)十萬及美元的價格,將使用權(quán)出售給美國DEC公司,成為中國第一個出口美國的電腦專利技術(shù)。

此后IBM,微軟,蘋果陸續(xù)購買專利使用權(quán)。

而東南亞國家如馬來西亞和新加坡,更是至今還在廣泛使用五筆。

在國內(nèi),五筆也成為一代中國人最早接觸和學(xué)習(xí)的漢字輸入法。

在電腦還不普及的90年代,使用電腦被認為是一種職業(yè)技能,國內(nèi)有大量的培訓(xùn)班,而五筆就是這些培訓(xùn)班最重要的授課內(nèi)容。

當年的許多國產(chǎn)電腦,鍵盤上不僅有英文字母,也標注了五筆字根,方便學(xué)習(xí)。

但就是這樣一個「當代活字印刷術(shù)」,為何卻淪為拼音輸入法的手下敗將,成為了「小眾」的代名詞和時代的眼淚呢?

02 五筆為何不敵拼音

1995年,智能ABC輸入法誕生。

這是一款經(jīng)典的拼音輸入法,用過智能ABC的,應(yīng)該都是和我一樣的老網(wǎng)民。

但經(jīng)典歸經(jīng)典,說實話,和現(xiàn)在的拼音輸入法比起來,當年的智能ABC和智能沒有半毛錢關(guān)系。

它的存在,就是提供了一個龐大的字詞庫,讓用戶查找拼音對應(yīng)的文字和詞語。

而它的詞庫其實也缺乏實用性,因為那個年代的詞庫主要是從官媒和各類報刊雜志的報道中統(tǒng)計高頻詞得來的,因此這樣的詞庫其實非常不符合普通人的語言需要,也沒有聯(lián)網(wǎng)更新詞庫的方式。

現(xiàn)在拼音輸入法必備的聯(lián)想輸入,模糊音,常用詞匯記憶等功能,在當時更是天方夜譚。

作為一名智能ABC十級選手,在長期的使用中,已經(jīng)養(yǎng)成了一種記憶:那些經(jīng)常用到的字,我都會記住在第幾頁。

而且因為詞庫不更新,有時必須想點笨辦法提高打字效率。比如當我想打「喜茶」,最快的方式是分別打出「喜歡」和「茶葉」,再刪掉多余的字。

總之,當時的拼音輸入法在效率上,和五筆是遠遠不能相提并論的。

拼音輸入為什么效率低?

一個點就是我們前面提到了,拼音的重碼率非常高,不考慮音調(diào)只有400多種組合,而這些組合要對應(yīng)的是成千上萬個漢字。

這意味著拼音不止要打字,還要選字,往往是輸入容易找字難。

尤其是某些讀音,對應(yīng)著大量多音字,例如zhi、chi、shi。

如果你的名字里有個yi字,恰巧還是個生僻字,而你只會用拼音輸入法,那么恭喜你,國標GB18030字集里,光是讀yi音的字就有407個。打字一時爽,找字火葬場。

在王永民提出的形碼設(shè)計三原理,第一原理就是「相容性原理」。也就是重碼率要低,確保編碼的唯一性。最好達到2%以內(nèi)。拼音里面 大量多音字同音字,效率顯然是不及格的。

為了改善效率,后來又有了雙拼輸入。不過只要是基于拼音,重碼就是解決不了的問題。

此外,五筆字型在按鍵排布上是經(jīng)過設(shè)計的。

從上方這張圖上就可以看出來,同樣是基于QWERTY鍵盤,五筆打字在兩只手的負荷率上,基本是平衡的。

但拼音輸入就是右手忙死,左手放假。而且如果你用標準的打字法,會發(fā)現(xiàn)左手最強壯的食指好像沒什么事做,但是力量最小的小指反而負荷很大。

簡單來說,拼音打字在人體工程上也不是很科學(xué)。

當然,這個鍋還是要丟給QWERTY鍵盤,這個鍵盤的鍵位設(shè)計本來就不合理,這個我后面還會展開講。

所以說,從效率和科學(xué)性來說,五筆是遠超拼音輸入法的存在。

真正改變了拼音輸入法尷尬局面的,一是靠內(nèi)存,二是靠互聯(lián)網(wǎng)。

作為一種極其依賴字詞庫的的輸入方式,拼音輸入法需要大量的存儲空間來存儲字庫。在80年代,電腦內(nèi)存按K來計算,存儲空間按MB來計算的時代,根本存不下足夠大的字庫。

直到90年代,主流電腦的硬盤容量已經(jīng)達到了GB級,內(nèi)存也達到了數(shù)十MB的水平,這才有了越來越龐大的拼音字庫。

字詞庫更大了,能夠匹配的詞匯也就多了,效率就提高了。

而互聯(lián)網(wǎng)帶來的則是更大的變化。

2006年,搜狗輸入法橫空出世。它在基本原理上和智能ABC,紫光拼音沒有太大的區(qū)別,唯一的不同是它通過搜狗的搜索引擎,極大地擴展了詞庫。

用戶輸入的拼音不再是與本地詞庫對應(yīng),而是與整個中文互聯(lián)網(wǎng)的內(nèi)容匹配。

除此之外,搜狗還包括了整句輸入、聯(lián)想輸入功能。要知道,整句打字的效率要比一個字一個字打高多了。而且很多時候你不用打完整的拼音,系統(tǒng)就會幫你補完。

此外,它還會記錄你常用的高頻詞,隨著你的使用,它會越來越順手。

這些功能的加入,讓拼音輸入法的效率直接起飛。搜狗輸入法一年內(nèi)搶下了90%的市場份額。即使后來騰訊百度谷歌也紛紛加入戰(zhàn)局,搜狗的市場份額也沒掉到70%以下。

但客觀一點來說,這些輸入法在本質(zhì)上,并沒有讓拼音成為更精確、重碼率更低的輸入方式。它只是用大數(shù)據(jù),大詞庫和聯(lián)網(wǎng)功能,強行提高了匹配效率。

這就像我聽過的一個關(guān)于程序員的笑話:

產(chǎn)品性能不夠,怎么辦?一個程序員會有兩種選擇,一是猛干六個月寫一個很復(fù)雜的程序,提高系統(tǒng)的性能。另一個是花半年休假,在家睡大覺。等你一覺醒來,更NB的硬件已經(jīng)降價了,直接換硬件就能解決問題了。

而拼音真正相比五筆的優(yōu)越之處,在于它是一種門檻更低的輸入方式。

漢字是字形,字聲,字義三位一體的文字,這三者中,我們往往是先理解了字聲和字義,也就是先學(xué)聽說,再學(xué)讀寫。

而且我們的思維也往往是以語音方式進行的,當我們想事情的時候,腦袋里本來也會有一個聲音。

相比五筆這樣的形碼,拼音作為聲碼門檻更低,也更符合我們的本能。

更可怕的是,拼音的背后,是一整個九年制義務(wù)教育體系。

拼音輸入法并不是沒有學(xué)習(xí)門檻,只是很少有人需要專門去學(xué)習(xí)拼音。

從小學(xué)一年級第一堂語文課開始,我們就在學(xué)習(xí)aoeiuü了,一直到高考,拼音就沒離開過語文學(xué)習(xí)。

以中國目前90%以上的九年制義務(wù)教育鞏固率,拼音對這一代中國年輕人來說,幾乎就是出廠設(shè)置。

有意思的是,五筆的用戶群中,反而有不少60后,他們沒有接受過完整的拼音教育,但能讀會寫。這批中老年人用起五筆反而更加順暢。

只是,在中國越來越完備的教育體系和龐大的拼音使用人口面前,五筆毫無勝算。

為什么互聯(lián)網(wǎng)公司愿意花大力氣開發(fā)拼音輸入法,也是因為用戶基數(shù)大,商業(yè)上具備想象空間,巨頭們才愿意在輸入法這樣的邊緣市場投入人力物力。

到了移動互聯(lián)網(wǎng)時代,拼音已經(jīng)真正意義上坐穩(wěn)了江山。

03 九宮格vs全鍵盤

還記得上學(xué)的時候,男生女生都喜歡買大一號的校服,袖子至少要能把手藏住。一半是為了把耳機藏進去,上課聽歌,一半是為了把手機塞在袖子里,上課時候互相發(fā)短信。

只有我,沒有女生和我發(fā)短信,我上課時候玩手機都是為了看NBA的文字直播。

那個時代雖然沒有大屏智能機,但因為手機有九宮格的實體按鍵,幾乎每個同學(xué)都熟練掌握盲打技巧。

而隨著智能機的普及,當年用慣了九宮格的我們,又開始用回了全鍵盤。

手機輸入法的歷史,還要從90年代講起。

1993年,諾基亞發(fā)布了第一款支持短信發(fā)送功能的GSM手機。

從此,手機不再是純粹的移動電話,它進入了文本時代。

但手機真正成為高效的文字通訊工具,還要歸功于一種叫做T9的輸入技術(shù)。

事實上,在西方國家,過去的電話號碼是包含數(shù)字和字母的,因此固定電話的數(shù)字鍵上也就標有字母。不僅是為了打字,也方便用戶記憶電話號碼。

這套鍵盤被稱為E.161鍵盤,而且有意思的是,很長時間這套鍵盤上都沒有Q和Z。

1995年,美國一家名叫特捷通訊( Tegic Communications )的軟件公司成立,這是一家專門針對小型電子設(shè)備開發(fā)技術(shù)的公司,后來被美國在線收購。而就是這家公司,研制出了T9輸入法。

T9比搜狗更早地使用了預(yù)測性文本技術(shù),也就是我們前面所說的常見字聯(lián)想輸入功能,而且它不僅支持拼音,還支持筆劃輸入。

這套技術(shù)讓手機打字有了質(zhì)的飛躍。

90年代末,T9輸入法就開始廣泛被三星、諾基亞等手機廠商使用。也就是我們俗稱的「九宮格」。

我記得當年九宮格最火的時候,還有很多相關(guān)的暗號,例如962464代表「我愛你」,647449633代表「你是我的」。

可能這就是屬于80/90后的土味情話了吧。

而全鍵盤和手機的結(jié)合,要到1996年了。

那年,諾基亞發(fā)布了一款名為9000的手機,也是世界上第一款全鍵盤手機。

它有一個類似筆記本電腦的設(shè)計,外部來看就是一個普通手機,翻開上蓋,里面就是一個大屏幕和一整個QWERTY鍵盤。

作為一臺定位商務(wù)人士的掌上電腦級別的產(chǎn)品,諾基亞9000不僅支持收發(fā)郵件,而且具備瀏覽器功能,支持網(wǎng)上沖浪。

擱96年,這簡直就是黑科技一般的存在了。

而全鍵盤,在很長時間里,也被認為是商務(wù)手機的標配。

后來的黑莓、Palm和諾基亞的E系列,主打的都是商務(wù)屬性,大量機型也都配備了全鍵盤。此外,側(cè)滑全鍵盤也流行過一段時間,比如諾基亞的一代機皇N97。

直到2007年,iPhone的發(fā)布,才改變了這一狀況。

很長時間里,蘋果對虛擬全鍵盤執(zhí)念都很深。一直到2013年的iOS7,蘋果才開始支持九宮格,而第二年的iOS8,蘋果才開放第三方輸入法。

但是因為相當長的時間里,主流智能機廠商,都將全鍵盤設(shè)置為默認輸入方式,導(dǎo)致在移動互聯(lián)網(wǎng)時代,全鍵盤輸入最終成為了主流。

這也造成了一個曠日持久的爭論,到底是九宮格效率高,還是全鍵盤效率高?

接下來的話,是我個人的私貨,各位權(quán)且一聽。

我看過很多說法,兩邊各有擁躉。用九宮格的人說,九宮格單手操作更方便,并且誤觸率更低,所以更容易盲打。

用全鍵盤的人就會反駁,現(xiàn)在手機屏幕夠大,沒那么容易誤觸了,雙手打字用全鍵盤顯然更精準,效率當然也會更高。

這時候用雙拼的人就會說,如果你經(jīng)過練習(xí),習(xí)慣了雙拼,雙拼才是速度最快的。

而五筆的遺老們則表示,都是渣渣,都不如五筆迅速。

但我發(fā)現(xiàn),大多數(shù)人爭的,根本不是效率。

我更喜歡用九宮格,僅僅是因為我是90后,在智能機出現(xiàn)之前,就已經(jīng)在諾基亞上把九宮格用得如火純青了。

對于剛接觸手機就是全鍵盤的人來說,這種跟電腦鍵盤更一致的輸入方式明明就更自然,為啥要費勁去學(xué)九宮格呢?

而像我爸,他那個年代,甚至沒有九年義務(wù)教育,很多人拼音都沒學(xué)好,第一次接觸打字就是五筆,讓他改用拼音打字根本不可能。

事實上,輸入法的效率確實有高低。但這個微小的區(qū)別放在日常的聊天和寫作當中,完全可以忽略不計。

我們追求的根本不是效率,我們只是在維護自己的習(xí)慣,自己成長的時代。

很多時候,我與人就某件事情,想爭論出一個高低時,我都會陡然發(fā)現(xiàn),支撐我瘋狂在網(wǎng)上搜尋論據(jù)的,不是我對正確的執(zhí)著,而是對立場的執(zhí)念。

輸入法只不過是溝通與輸出的工具,正如我們從不以說話的快慢來判斷語言的價值,比起「寫多快」,「寫什么」才是更重要的事。

這種對「效率」虛無的追求,其實往往會變成一種低效。

這不禁讓我想起有段時間我沉迷于對「效率」工具的使用,還經(jīng)常在朋友圈推薦一些我覺得不錯的軟件。

我學(xué)習(xí)了盧曼的卡片筆記法,嘗試過notion,用過flomo、obsidian、craft等等配合來做知識架構(gòu),付費過幕布也付費過xmind,光寫作軟件,我就換過ulysses、metion、bear、iawriter、typora等等等等,都只是為了提高一點點「效率」。

直到有天我看到一個帖子,作者作為資深效率軟件使用者,詳細對比了各軟件之間的優(yōu)缺點,并提供了自己的使用經(jīng)驗。

帖子結(jié)尾則說道:現(xiàn)在我開始用筆和紙了。

突然讓我有種置身劍冢,看到獨孤求敗那句「四十歲后,不滯于物,草木竹石均可為劍。自此精修,漸進于無劍勝有劍之境?!沟母杏X。

這才叫境界。

關(guān)鍵詞: 中文輸入法

相關(guān)閱讀:
熱點
圖片 圖片