此为历史版本和 IPFS 入口查阅区,回到作品页
閑閑
IPFS 指纹 这是什么

作品指纹

明快打字機(一)── 上下形檢字法規則整理

閑閑
·
·
最近在研究中文輸入法時,發現了「明快打字機」這件發明,網絡上雖然有所說明,但不太詳細,故此自己研究了「明快」前身「上下形檢字法」的規則,以助了解「明快」的原理。

簡介

雖然說上下形檢字法是明快的前身,按林太乙所寫《林語堂傳)中所述,明快打字機是於一九四七年五月二十二日對公眾發表。而上下形檢字法的,是記於1970出版的林語堂《當代漢英詞典》中的。故此,應為林語堂將其明快打字機的檢字方式加以改良,成為上下形檢字法。下文先引述林語堂於封面內面中的說明,再說明這些規則實際的取碼情況。


上下形檢字法

整合了封面內面兩圖表的鍵位圖


所有的字,取其上下,沒有例外。

上下形一共33個,分為十類,即「了十廿三四五六七」等本來形體。

1.只按位置取碼

只按形狀在字的高低取碼,與筆順無關。

2.左右結構

字可為截然為左右名為S;不可截然分左右者名為NS(輸入法中記為N)。

3.五十部首

康熙214部首,取其常用者50,其餘盡併為S類,部首必在上形,不在上形者,仍為S類。警上形卄(20)不在言部,漿上形𠃊(21)不在水部。

4.餘形上部

同上下形之字,以餘部上形為次序。


對上述規則的說明

只按位置取碼

  1. 一般程況是先論上下,再論左右。
  2. 「辵、廴」部的上形一律按右邊部件的左上角取碼,即視作「辶」較右方部件為低,而書中字體兩者為平齊)。例「造」取碼10.83,不應取63.83。
  3. 是否應和倉頡相同,有多種取形方式時保留筆劃轉角的字根有待相確。保留筆劃轉角的例子:「七」應作10.70,而非30.70(有70.70的容錯碼),「干」應作31.10,而非30.10。反例:「力」作91.50,不作12.50。

左右結構

依傳統形式分割,左右兩者有可獨立成字時分割較好,例:「北」應作22.70,而非22S.70。大多情況下都有容錯碼。

五十部首

  1. 大致上和鄭碼的第一主根類似,或倉頡的複合字類似,實際上和部首概念沒有大關係。下文稱之為輔根。
  2. 部首字本身需單獨拆碼。例如「木」應作10.01,而非10B.00。大多情況下都有容錯碼。反之,「心」可作72.72,而不需另外再取。

餘形上部

  1. 與四角字碼的附角形式相似。
  2. 一般只有帶附根的字,和左右分割的字帶附碼。即「ABCDS」帶附碼。
  3. 非左右分割的字中, 只有「囗、風、匚、鬥、門、亠𧘇、鬼」帶有輔碼。
  4. 「廴、辶、是」等字沒有輔碼。
  5. 附碼相同的字按筆劃排列。
  6. 同樣00-02不會組成上形,即沙應為63A.91-2,而非63A.91-0。

推行困難的原因

重字率高

相比起四角號碼檢字法,上下形檢字法只用了五個字元來表示兩個字形特徵,即使是加上輔根和附角的重碼率亦相當高。加上沒有使用像四角一樣避免「囗、門、鬥」(由整個「囗」「門」「鬥」組成的字(不包括這三個字自身),下方取內部的筆。)重碼的方式,因此引致大量重碼。特別是「門」部,雖然有輔根「52B 門」,但所有門部字下形都是折鈎,即故此「門」部的所有字編碼都是「52B.00」。考慮到「52.00」只收了一個字「擘」,即設立了52B這個輔根卻只避免了和一個字的重碼,設置相當不合理。

對半包圍的處理不統一。

對於半包圍的字,上下形有三種處理手法:

一.視作右方部件較高,先取右方部件的碼。(廴、辶)

例:迴 41.83 延91.83

二.和正常字的處理方式一樣,先取左方部件的碼。(風、麥、毛、鼠)

例:麵 10.83 颱42.70 毯90.70 鼦90.70

兩種處理方法都有其不當之處,方法一打破了取左上的原則,而且沒有了餘形上部,不能再再字形切割,沒有了附碼。方法二引致內部部件的碼沒有被取,引致大量重碼,可謂不合理。


總結

由於只取上形和下形兩碼的關係,故此使這檢字法更像是基於部首檢字法的升級版,對於難檢字和大量字庫時見顯得力不從心。故此連中文大學的當代漢英字典都不支持使用上下形檢字法,落入洪流之中是無何奈何的事情。

明快打字機作為中文輸入法的先騎,假若可以借現今電腦技術將其複刻,不失為一件美事,但我在調查時卻發現網上對明快打字機的編碼規則沒有詳細的描述,假若有意複刻明快打字機的可以聯繫我。

延伸閱讀

Mullaney, T. S. (2018). The Chinese typewriter: a history. MIT Press.

Tsu, J. (2011). Lin Yutang’s Typewriter. Sound and Script in Chinese Diaspora, 49–79. https://doi.org/10.2307/j.ctvjnrskk.7

CC BY-NC-ND 2.0 授权