湘里妹子学术网

 找回密码
 注册
查看: 2752|回复: 0

台灣話的電腦化

[复制链接]
发表于 2003-12-28 05:29:32 | 显示全部楼层 |阅读模式
<center>
<table cols="1" cellPadding="8" width="480" bgColor="#ffffcc" border="5">
  <tr>
    <td vAlign="center" align="middle"><tt><font color="#ea0000" face="標楷體">
    <font size="+4">台灣話</font><font size="+3">的</font><font size="+4">電腦化</font></font></tt></td>
  </tr>
</table>
</center>
<p>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
1989年6月22日 台灣公論報</p>
<p align="center"><font size="+1" face="標楷體">林繼雄</font></p>
<hr width="100%" SIZE="1"><hr width="100%">
<p><font color="#d50000">〔<b><font size="+1">速 選〕</font></b></font><b> <font color="#d50000">(1)</font><a href="http://www.edutech.org.tw/Prospects/1">前 言</a>  <font face="Times New Roman CE"><font color="#d50000">(2)</font><a href="#2">台灣話的文書處理機</a>  
<font color="#d50000">(3)</font><a href="#3">電腦檔案系統</a></font></b> <br>
<b><font face="Times New Roman CE">   <font color="#d50000">(4)</font><a href="#4">台語文書個的智慧處理法</a> <font color="#d50000">(5)</font><a href="#5">台灣話語的自動解析與處理</a><font size="+2"> </font><font color="#d50000">
(6)</font> <a href="#6">結 語</a>.</font></b> </p>
<hr width="100%" SIZE="1"><center>
<table cols="4" width="710" border="0">
  <tr>
    <td vAlign="center" align="middle" width="252"> </td>
    <td vAlign="top" align="middle" width="180"><font face="新細明體">
    <font color="#ff0000">● → </font><b>
    <a href="http://www.edutech.org.tw/Prospects/Computer-age.htm">台 語 文 版</a></b></font></td>
    <td vAlign="center" align="middle" width="150"><font color="#00aa55">●<b>→</b></font><b><font face="新細明體"><a href="http://www.edutech.org.tw/Prospects/Prospects0.htm">現代文前景</a></font></b></td>
    <td vAlign="center" align="middle" width="180" height="1">
    <font color="#ff6a6a">●<b>→</b></font><b><font size="+1" face="Arial CE"><a href="http://www.edutech.org.tw/index.htm">EDUTECH</a></font></b></td>
  </tr>
</table>
</center><hr width="100%" SIZE="1">
<p><font size="+1" face="標楷體">&nbsp;&nbsp; 欲以台灣人的母語 一 台灣話,迎接資訊時代的來臨,必須考慮如何建立起台灣話的電腦化系統。&nbsp;&nbsp;
這個系統,應該是依循國際上已確立的資訊化語文體系,以便立即應用歐美的資訊科技成果,而不必每每為各項技術的重新開發來投下無謂的人力腦力與時間。台灣話現代文書法的廣範採用,可使
台灣話的電惱化問題,迎頭解決。&nbsp;</font> </p>
<hr width="100%" SIZE="1">
<p><br>
<b><tt><font color="#ff0000" face="標楷體"><font size="+2">1. 前 言</font></font></tt></b>
</p>
<p>&nbsp;<font face="新細明體">&nbsp;&nbsp; 數百年來,台灣人把唐朝前已經確立的漢文,當為文書用語而隔立於口語之外。這一安排,一方面使漢字文體一直保持了
一千多年前的形式,而一方面又使台海口語有充分自由的空間去發展。吾人今天所謂的台灣話就是如此發展出來的台灣口語。
這是台灣人平常生活上所使用的語言,是有情感而不拘形式的,卻充滿著生命力的語言。</font> </p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp;
在現在的國際科技文明杜會中,台灣人要生存,必須要建立可與其他民族相平行的,自身的杜會文化體系。文化的依據是語言,而現代杜會的營邉t須依靠現代化的語文系統。
台灣話,除了可用處理效能很低的漢字文來表達以外,還可利用依賴二十七個字母的現代文書法。在資訊時代裡,吾國人所能依賴以建立和諧而富有活力的杜會秩序的文書法,就是這個現代文書法。</font>
</p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 台灣話如何電腦化之疑問,在放棄漢字文及非正規文書形態的音標記號法之後,就自然地解決。
 事實上,我們一旦普遍採用 了現代文書法,則台灣話的電腦化問題就成為同於英語的電腦化那樣,既自然且可行。 
歐美諸國在過去二十年來為此開發的電腦化技術,將全盤可以利用於台灣的資訊杜會之建立。</font> </p>
<p>&nbsp;<font face="Times New Roman CE">&nbsp;&nbsp; 資訊時代的台灣話語文,使用「現代文書法」。  這是可與英文
、法文、德文等比肩的正規語文法。  其採用,需要我們在教育制度上,做一些新的認識。 正規的台語教育將像英文法文的教育,由語辭單字 (word-spelIing)
之辨認與記憶開始。  我們叫 &quot;蒼蠅&quot; 為 hosiin 就不管它要寫什麼漢字,而只記住英文 fly 在台語是 hosiin。    同樣地, 記walk是 k<i>v</i>iaa,jump是
thiaux,stand是 khia,run是 zao, stop是 theeng等。  有了單字,也同時要認識台語的語法,如將 I go to
schoo1.說成為 Goar khix haghau,又進一步學習台語文法,瞭解甚麼情況下要變換動詞為 b<u>o</u>eq khix,tehb<u>o</u>eq
khix, teq khix, b<u>o</u>e khix, m khix 及 khix kaux等,以建立台語文藝基礎。</font> </p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 我們可以期待,自幼時就如此受正規台語教育的今後台灣小孩,將會像其他文明國家的小孩一樣,逐步以
ABC字母拼字來建立台語語彙,也會很快地使用英文打字機或各式文書處理機來寫字,甚至作出符合其年齡的文藝作品。?我們必會循著時代進步的潮流,融合電惱科技於各自的生活,工作及創作生涯之中。&nbsp;
這時,台灣話就已實質地電腦化了。</font> </p>
<p><font face="Times New Roman CE">&nbsp;&nbsp;&nbsp;
台灣話的電腦化對我們未來的發展,有不可限量的影響力。 在中國大陸,數年前就開始的漢語拼字化之推動,也著眼於民族的現代化國際化。  唯其成功與否,尚須待觀察。  
北京話語音不像台語語音之明確不含糊,而二辭同拼字之情事太頻繁將是他們的難題。 
台語的現代文書法所訂立的文法語法體系,使台灣話文成為可與歐美語文相提並論,將在本文中看出其一二。  本文為台灣人今後在國際上的發展,提示了台灣話電腦化的
一些實質研究方向。 盼望有志於資訊科技的同鄉協同探討。  此中所論的內容有:(1)台灣話的文書處理機,&nbsp; (2)電腦檔案系統,(3)台語文書的智慧處理法,以及
(4)台灣話語的自動解析與處理。 .</font> </p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 我們可在這些討論之中看出,台灣語文的電腦化不是僅僅是台灣語文在電腦上可不可以顯示而印出來的問題。 
在資訊科技上,語文必須符合 &quot;一個字一個電訊碼&quot; 的大原則。   如此才能依照現代資訊科技之開發趨勢推展台灣語文的現代化。 語文曾經是文化延績的依據。  
如今,符合資訊科技的語文體系,成為該民族在未來人類杜會中欲與其他民族並肩發展的關鍵條件。  台灣話的「現代文書法」已為台漫人開拓了這一個可能性。</font>
<br>
     <br>
    <br>
<b><tt><font color="#ff0000" face="標楷體"><font size="+2">2 台灣話的文書處理機</font></font></tt></b>
</p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 台語的現代文書法以下列的台語字母序(Taiwanese alphabet) 來拼出台灣話的語辭(word).</font>
<br>
&nbsp; <br>
&nbsp; </p>
<center>
<table height="10" cols="1" width="620" bgColor="#ffffff" border="2">
  <tr>
    <td vAlign="center" align="middle"><b>
    <font size="+1" face="Times New Roman CE">Aa&nbsp;&nbsp; Bb&nbsp;&nbsp; Cc&nbsp;&nbsp; Dd&nbsp;&nbsp; Ee&nbsp;&nbsp; Ff&nbsp;&nbsp; Gg&nbsp;&nbsp;
    Hh&nbsp;&nbsp; Ii&nbsp;&nbsp; Jj&nbsp;&nbsp; Kk&nbsp;&nbsp; Ll&nbsp;&nbsp; Mm&nbsp;&nbsp; Nn&nbsp;</font></b> <br>
    <b><font size="+1" face="Times New Roman CE">Oo&nbsp; <u>Oo</u>&nbsp;&nbsp; Pp&nbsp; Qq&nbsp;&nbsp; Rr&nbsp;&nbsp;
    Ss&nbsp;&nbsp; Tt&nbsp;&nbsp; Uu  <i>Vv&nbsp;</i>&nbsp; Ww&nbsp;&nbsp; Xx&nbsp;&nbsp; Yy&nbsp;&nbsp; Zz&nbsp;</font></b></td>
  </tr>
</table>
</center>
<p><font face="新細明體">此二十七字母中,</font><u><font size="+1" face="Times New Roman CE">Oo</font></u><font face="新細明體">字代表看台語「蠔仔」之首音。 
另外在英文<font size="+1">Vv</font>使用斜體字,它本身或直連在子音字之後,就表現出台語特有的鼻音。 
在記號字方面,幾乎同於英文中之記號字,如 ! &quot; # $ % &amp; * ( ) - + [ ] { }  : ; " &lt; &gt; ? , . / 等。  
只有一個強辭記號 (<sup><font size="-2">+</font></sup>),異乎數學記號(+)。</font> </p>
<p><b><tt><font color="#ff0000" face="標楷體"><font size="+2">2a 全拼字文的智慧型文書處理機</font></font></tt></b>
</p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 智慧型化的第一步是使它能自動研判你所打進去的每一語辭之拼字(spelIing)以發出拼字錯誤的信號聲,或進一步依你的要求來自動改正錯字。</font>
</p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 為此目的,處理機內必需有足夥容納數千個台語常用語辭 的記憶體,以執行比對。  執行這個比對的時機是在你按下
space, return, 及 .,; &quot; ?!i ) ] - <sup><font size="-2">+</font></sup> 等的時候。</font>
</p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp;
和英文智慧型文書處理機一樣,比對是對整個語辭來執行的,可是由於台灣話現代文書法的拼字特性,可進一步對一些特定的二音節合成群,安排以程式來分析辭源而比對其中的一音節。</font>
</p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 這種可分解來比對的合成辭有直連了助詞的單音節動詞和直連了方向辭的單音節名詞。 
電腦由這些合成辭的辭尾形態來認識它而執行分析。   辭尾助詞有 ~teq, ~ti<u>o</u>h, ~laai, ~khix 等, 辭尾方向辭有 ~e, ~siong,
~terng, ~Iai, ~khaf,等。  技術程序是先比對辭尾來切斷,此時已知前辭是動詞或名詞,放在分別的單音節字檔中做比對。</font> </p>
<p><b><tt><font color="#ff0000" face="標楷體"><font size="+2">2b. 漢字文文書處理機</font></font></tt></b>
</p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 為了要編寫音漢混合式文章,需要有漢字字形碼的文書處理機。  為此,日人已有相當的開發。  
筆者曾於1988年初以約一千美金在日購買了一架,一直用以編寫文書及著作書籍。  它擁有 6870個漢字,其中不少是日式簡體字。  
另外可自已造字來存入磁碟的備用 &quot;外字&quot;,共可造 940個可直接叫出來。</font> </p>
<p><font face="新細明體">&nbsp;&nbsp;&nbsp; 漢字使用四位數值叫出。   但也可用日語發音來叫出一部分的同一語音的漢字。 
這是比數值方便的叫法,可是你得要懂得漢字的日語發音。   日文的漢字字音不及400種,所以一次叫出來的漢字,往往多達一二百字,再一一選擇,相當麻煩。 
如果是現代拼字的台語 ,則可分辨三千一百多種不同發音的拼字,必然是很高效率的。  日製文書處理機也可用整句日文的發音來叫出多數漢字的句子。  
因為日語多的是同音異義的句子,所以叫出來後還要繼填按鍵選擇才可選到。  台語極少同音異義的句子,可少做選擇。</font> <br>
   <br>
<font face="新細明體">  因為日本工業規格<font size="+1">JIS</font>中的漢字,雖然包括有大學論語等古書中漢字,卻不含現代華文中的字眼,如:她你咱另呢嗎駕吧爸碰搵夥等。 
所以買來之後,必須很辛苦地造出很多台語漢字,才能使用。   更大問題是叫字用日語,所以不會日語就很難叫字了。</font> <br>
   <br>
<font face="新細明體"> 在台灣(1989年),有一公司造過用ㄅㄆㄇ叫字的可攜帶的中文文書處理機。 
可惜文化工作者及學生之間ㄅㄆㄇ不太普及,又要一個音一個漢字的叫字法 不如中文打字機靈活,字形品質也差,而文書處理的觀念未如中文電腦那樣被接受。</font>
<br>
   <br>
    <br>
    <br>
<b><tt><font size="+2" color="#ff0000">3. 電腦檔案處理</font></tt></b> </p>
<p><font face="新細明體"> 大家購買微電腦,大都是為了建立某種資料的檔案處理系統。  
此包括人事資料、財務資料、產品資料、原料庫存資科等的建檔記錄。  說起來,它就像是一本隨時可改訂的電話簿,記事簿, 圖書館藏書分類卡。
 新增的資料,由鍵盤輸入,則自動適宜安排來貯存起來,又有事查詢時也會瞬間地找到所要的資料及有關的項目,而展示出來或列表印刷出來。 在當今的工商企業中,電腦檔案系統是不可或缺的行政管理工具。</font>
</p>
<p><font face="新細明體">  已被開發上市的微電腦資料管理系統軟體很多,叫做 <font size="+1">DBMS</font>(Data-Base
Managenent System)。   在科技研究上,我們或許需要為了某些特殊性質的資料,如化學光譜,設計出專用的 <font size="+1">DBMS</font>,但是為一般的工商企業界、買一個市販者為出發點是足夠用的了。</font>
<br>
  <br>
<font face="新細明體">  在電腦檔案中所存錄的,有各型的數據資料,也有明碼資料和密碼資料。 
明碼資料就是像人名地名物品名稱等,叫出來一讀就可瞭解的字串,而密碼資料就是為了節省記憶媒體空間而以一個字或一個數目值來代表某些特定事務的記錄。 
通常是在輸入前已經編碼(encode)好的,也有寫進到自動編碼程式,讓電腦由人們所輸入的明碼資料改造得來的。 
在事後要展示時,也可以經由解碼(decode)之程式來轉回成可以看僅的明碼。</font> <br>
  <br>
<font face="新細明體"> <font size="+1">DBMS</font>不僅包括有 :
由鍵盤搬移資料到記譯體的,所謂的存檔程式,以及依據所按入的鍵語(keyword)去找出資料的查檔程式,也包括了在電惱映像幕上及報表紙上適宜編排的列印程式。 
此外也有能夠記憶住數百數千的資料,依序重排的排序程式以及 依照所指定的數學規則去變更資料值的程式等。</font> <br>
<font face="新細明體"> </font>  <br>
<font face="新細明體"> 在這些程式中所依據的是數據資料之大小關係和字碼資料的字母順序。  此後者就跟所用資料的語言拼字法有關了。</font>
<br>
  <br>
<font face="新細明體"> 如果字串所用的是漢字,則個個漢字的某些編號就成為排序的依據了。  這個鎘號,叫做 &quot;交換碼&quot; 的,在不同電腦上多年來
一直不能統一,業者要求政府發令規劃以利資訊業能有所據而不得。  所以,交換碼問題就成為中文電惱的一大未決爭執,而阻礙了台灣資訊科技的實質發展。 
這裡只有一個禁令,就是不可採取日本或中共的交換碼。   我們只好不去碰了。</font> <br>
  <br>
<font face="新細明體"> 由上可知,台語的電腦化如果要採用漢字,則必須等到那個爭執有了定論的將來。 
而且,還得要看,在國際間繁忙的商務競爭中,你是否願意為查詢某事就把台語意念翻譯成為漢字,又去調查它的交換碼才來輸入電腦中。 
另一困惑是,現在的政府所資助設立的漢字字型碼並不包括台灣話專用的漢字。  當然也沒有這些的交換碼了。</font> </p>
<p><font face="新細明體">
 如果台灣人暫且放棄中文電惱的意念,使用不加特殊聲調記號的現代拼字,直接用台語來操作電惱,那麼我們就必然會在這個國際競爭中搶先一步,加入資訊化民族之列了。 
在科技發展上 ,漢字是我們的歷史包袱,而一百年前英國傳教師發明給我們的台語音標寫法又何嘗不是<font size="+1">?</font> 我們可以懷念感恩,可是不可因此抱守殘缺而自絕於人類進步的行列。 
我們要為我們的子孫想想。&nbsp;</font> <br>
<font face="新細明體">  </font> <br>
<font face="新細明體">   </font> <br>
<b><tt><font size="+2" color="#ff0000">4.台語文書的自動處理</font></tt></b> </p>
<p><font face="新細明體"> 人類自然語言(natural language)的電腦處理問題,很早就被開始研究探討。 
原來,聽到某一種外國話語就自動說出你所瞭解的話語的機械,是人們長久以來的夢想。  記得五十多年前,筆者讀過日人的兒童科幻小說,其中就述及語言翻譯樵的使用。 
最近幾月,才看到能將日語翻譯成英語的微電腦已經上市。   台灣話當然也可以做到。</font> <br>
   <br>
<font face="新細明體"> 電腦用以探討自然語言的嘗試,始於1949年。  此年 <font size="+1">H.Heaver </font>
首次開發出原始的語言翻譯機。   可是,卻馬上發現事情並沒有那麼單純。  翻譯,包含對兩種語言的徹底瞭解。   於是,當1960年代,
人工智慧的觀念興起之後,則有不少人投入如何使電惱 &quot;瞭解&quot; 以某一自然語言(主要是英語)所寫出來的文章的意義。   事實上
,電腦要有能力去瞭解文章中所提的問題,才能夠適切地做問答。  可見,如何使電腦去瞭解自然語言就成為1980年代起成為熱門的各料專家系統(expert
system):的最根基的課題。</font> <br>
  <br>
<font face="新細明體"> 要瞭解一篇文章,必須能解析其中語句的互相關係。 
於是,我們必須為電腦開發出依照該自然語言的文法(grammar)去解析文章的能力。  電腦所用的是數學的方法,所以就需要一套新數學。  1950年代,由<font size="+1">
N.Chomsky</font> 所發明的 &quot;形式語言學 Formal Language&quot; 開啟了文章的剖析程序(parsing]的軟體技術。 
由此,我們將可以讓電惱看僅台灣話現代文了。   請看下面的文章(台語) :</font> <br>
<font face="Times New Roman CE"><font size="+1">  </font><b>Ti sitbang-tiofng
teq zerngzad ee goar kab yn-lauxpe z<u>o</u>rh<u>o</u>ea zexti<u>o</u>h h<u>o</u>efchiaf
ciu hiorngti<u>o</u>h lanpeeng tidtit khix, ia mxzay si uixti<u>o</u>h symnih
bogtek.</b></font> <br>
<font face="新細明體"> 依照 &quot;由下往上剖析&quot; 的文法解祈(syntactic analysis)後,知道其主旨是 &quot;</font><font size="+1" face="Times New Roman CE">Goarn
khix&nbsp; lanpeeng</font><font face="新細明體">(阮去南胖旁)&quot;,也知道</font><font size="+1" face="Times New Roman CE">goarn</font><font face="新細明體">是包括了誰,</font><font size="+1" face="Times New Roman CE">goarn</font><font face="新細明體">的心態如何,這個心態的起因是什麼,又
</font><font size="+1" face="Times New Roman CE">goarn </font><font face="新細明體">
如何 </font><font size="+1" face="Times New Roman CE">khix</font><font face="新細明體">,怎麼變為往
</font><font size="+1" face="Times New Roman CE">lampeeng</font><font face="新細明體">,</font><font size="+1" face="Times New Roman CE">khix</font><font face="新細明體">
的實倩如何,以及 </font><font size="+1"><font face="Times New Roman CE">goarn khx</font><font face="新細明體">
</font></font><font face="新細明體">的動作當中的心態如何等。</font> <br>
  <br>
<font face="新細明體"> 話語是線型的。   這種一個字一個字地進來的文章,經過文法解祈之後,就成了遍蓋整個局勢的架構。  即文章的非線型化(
nonl;nearlization)導致了對事態的瞭解。</font> <br>
  <br>
<font face="新細明體"> 剖析的工作,有賴電腦對文中台語語辭的文法地位的判斷能力。 
電腦在此,也可用比對法,可是台語語辭的拼字特徵和排列順序是很有效的依據。  對上面的文章,它用比對法看出 </font>
<font face="Times New Roman CE"><font size="+1">khix</font>, <font size="+1">
mxzay </font></font><font face="新細明體">和 </font>
<font size="+1" face="Times New Roman CE">si </font><font face="新細明體">是動詞,再由辭尾助詞
</font><font size="+1" face="Times New Roman CE">-ti<u>o</u>h </font>
<font face="新細明體">來得知 </font><font size="+1"><font face="Times New Roman CE">
zexti<u>o</u>h</font><font face="新細明體">, </font><font face="Times New Roman CE">
hiorngtioh</font><font face="新細明體">, </font></font><font face="新細明體">和 </font>
<font size="+1" face="Times New Roman CE">uixti<u>o</u>h </font>
<font face="新細明體">也是動詞。  台語的助動詞後必為動詞或動詞片語, 所以判斷出<font size="+1"> teq </font>
後面的少見的語辭 </font><font size="+1" face="Times New Roman CE">zerngzad</font><font face="新細明體">(掙扎)也必為動詞。名詞或名詞片語的判斷有
(1).及物動詞</font><font size="+1" face="Times New Roman CE">-ti<u>o</u>h</font><font face="新細明體">之後、
2. </font><font size="+1" face="Times New Roman CE">si </font><font face="新細明體">
之後、(3) 連接詞 </font><font size="+1" face="Times New Roman CE">ee</font><font face="新細明體">
之前面,等。</font> </p>
<p> 台灣人不用文字之注解也聽懂別人的話,是因為台灣話有很<font face="新細明體">明確的文法糙系。 不符合文法的說話,別人聽起來就覺得怪怪的。 雖然不敢明言指責,心中就想他所說的是嬰兒話(babytalk)。 例如,
前置辭 ti(在),ho(使),ka(拾),tuix(對)等之後必須放名詞 或代名詞。 這是文法之規定,可是有些小孩常常犯這個錯誤,而忽略代名詞 y(伊)。
 這是因為嬰兒時跌倒而哭就聽到媽媽一面打椅子一面性急地說:&quot;Ka"phaq, ka"phaq.&quot;  遂而把 Ka y phaq. 的 y
省略成習慣。 英文中也有這棣的兒語問題,而嚴重的就成為 pidgin Engliish 了。</font> <br>
  <br>
<font face="新細明體"> 符合文法形式的 ka &lt;某人&gt;&lt;動作&gt;,被電腦瞭解為某人受到了某一動作,而語辭 (動作)也被判斷為一個動詞。 例如:
&quot;Ka y ka.&quot; 中的第二個 ka 必是動詞 &quot;咬&quot;。 不符合文法形式的說法會被電腦排斥。 又兒語 &quot;給咬 ka ka&quot; 也不能接受。
只有強調了動作行為本身的 Goar ka<sup><font size="-2">+</font></sup>y,(唸成 ka"ix)是符合文法的; 因為 ka<sup><font size="-2">+</font></sup>y
就是&quot;對他做了咬的動作‥.</font><font face="Times New Roman CE">Ka y k<i>v</i>oarbai.</font><font face="新細明體">
(看一看他)如果說成 </font><font face="Times New Roman CE">Ka kh<i>v</i>oarbai</font><font face="新細明體">.意思就變為&quot;咬咬看&quot;。</font>
<br>
  <br>
<font face="新細明體"> 以上所例示的電腦語言學(computer
linguistics)研究,對歐美語言已有相當的進展,而愛成現時代的語言學的探討中心課題。 對於台灣話,這不過是一點開端而已。 台灣話文章中的文法錯誤(illegal
syntax)
之修改,不同語意表現法的試探,對其他語言的翻譯,及長篇文章的自動摘錄等,都要仰賴於此。 台語的現代文書法,使台語文成為可用人工智慧法來探討研究開發的形態。 留下來的,就是大家的自覺與努力了。</font>
<br>
<font face="新細明體">   </font> </p>
<p><font face="新細明體"> </font> <br>
<b><tt><font size="+2" color="#ff0000">5 台灣話的自動解析與處理</font></tt></b> <br>
  <br>
<font face="新細明體"> 語言學自古以來,分為書寫語言(written language)和口語語言(oral
language)來探討。 此二者均為現代資訊科技的研究開發的對象。  此外還有訊息語言(signal language) 如手語旗語等。</font> <br>
  <br>
 <font face="新細明體">上節所例示約台灣話文書法,以及由此延伸出來的台語文法、語辭組合法、情緒的文字表現法等,均屬於書寫語言之探討範圍。 另一方面,用心反省自已的語音也考察別人所說的話音,來研討語音的分類,情緒對聲音聲調之影響規則等,就屬於口語語言之探討範圍。</font>
<br>
  <br>
 <font face="新細明體">台灣的語言學專家,似乎特別喜歡爭論台語的語音問題,這是因為在現代文書法問世之前,台語沒有過漢文以外的真正的書寫語言供人討論。 口語語音之研究,一向有發音語音學(articulatory
phonetics), 音效語音學(acoustic phonetics)與 聽覺語音學(auditory phonetics) 三個研究方向。 
為了讓一般人瞭解所指的是甚麼語音,也就有了國際音標記號,國語注音記號等語音描述(phonetic description),依語言學的規定,應該把它放在音標括弧
[ ] 之內,以與正規的文字分辨。 例如台語的 &quot;噴射機&quot; 記為phurnsiaxky [phu<sup><font size="-2">2</font></sup>n.sia<sup><font size="-2">3</font></sup>.ki<sup><font size="-2">1</font></sup>]; 在此,「語音描述」使用了數字型羅馬拼音字,其中也有[
. ]是無聲片段(unvoiced segment)記號。</font> <br>
<font face="新細明體"> </font> <br>
<font face="新細明體">
 語音描述不是正規文字。 它使用了各型相當任意的沒有名字的記號,英語中的特殊音標記號等,所以不能按照正常的唸著字母名來記憶的語辭拼字學習法去記住它的排序。</font>
<br>
  <br>
<font face="新細明體">  語音描述是語音的注解; 你必須要先對那個語句有瞭解,也懂它的準確發音聲調,才能藉看自我反省過程去寫出它的語音描述。</font>
<br>
  <br>
 <font face="新細明體">正規文字卻是語句涵義的約定。 你記住 g-o-a-r 就可學到一個語辭 &quot;我 goar"。 我們學習任何外國語,都依靠它的文字,然後為了糾正語音,才研習各辭的語音描述,即音標。</font>
<br>
  <br>
<font face="新細明體">
 近三十年來,語音學重新受到科學家的大力探討,是與資訊科技之發展有關連的。 我們希望電腦的輸入不必用按鍵打字,而可用更快速且不佔用雙手的話語辭令。 口頭命令如何傳入電腦中
,使它瞭解呢<font size="+1">?  </font>聲音藉看聲波而傳遞。 不同聲音有不同的聲波,所以個別的話語,必能由聲波的分析來分辨。 </font>
<br>
  <br>
<font face="新細明體">
 1978年前後,筆者參與過這種讓電腦來研判人們口語的研究工作。 後來因為忙於專家系統的開發而不再去從事這個電腦語音學(computer
phonetics)的探討。 據筆者所知,國內現有不少人在進行研究,而日美的研究成果更為豐碩,已達實用的階段。</font> <br>
<font face="新細明體"> </font> <br>
<font face="新細明體"> 語音波形的測試解析,始於1968年 P. Vicence,他用三個不同頻率的感知器(150-900Hz,900-2200Hz,2200-5000Hz),每
0.00001 秒測一次強度來造出聲諳,當為不同語音的分辨依據。 此工作之後,美國國防部執行了五年的<font size="+1">ARPA</font>計劃,然後就有不少研究機構也為專家系統的開發而繼續投進相當的資金以獲得深入的研究成果。 語音的解析,自然延伸到語音的電腦合成:。
1983年時小小的Apple-II微電腦就已經會說英語了。</font> <br>
  <br>
<font face="新細明體">
 英語和其他歐洲語言都屬於粘性的,語辭易合的語言。 當你連續說一段話的時候,各句語辭的發音並不分開。 這件事實使歐美的語音資訊學者不得不放棄原先的孤立語辭辨認機(isolated-wrd
recognition system, IHRS)之構想,而改向話語整套瞭解機(speech understanding system, SUS)之開發研究。</font>
<br>
<font face="新細明體"> </font> <br>
<font face="新細明體">  依筆者的初步研究,台灣話卻相當滿足地可用簡易的 IHRS
就能將話語變換成現代文書法的文章,然後再用前節的台語文書自動處理程式去處理。 只是說話者必須瞭解對方是電腦,而就像對外國人講話一般地,每句每句不加辭尾轉調地說給它聽。 電腦要記憶的基本語辭,需要三四干句。 我們在此方面的研究開發,有很高的實用性。 只會記憶數十句語句來分辨的產品也有商用價值。 在台灣,已經開發出極廉價的語音處理樵(美金數元),而利用它所造出的玩具及車上電話機也已經賣出來了,它把你的聲音記憶起來,而當你再叫時,就用你的聲音去自動查出號數來接通電話。</font>
<br>
<font face="新細明體"> </font> <br>
<font face="新細明體"> 要讓電腦來瞭解你所說的一段演說,就得給它有能力把你的話語聲波,轉換為現代文書法的文章。 在此當中有相當多的問題 。
 其中最嚴重的是你的台灣話發音。 
幾十年來,我們一直沒有正常的台灣話語音語文教育,以致於一般人不知道甚麼是正確的台灣話發音。 很多人自認會說台灣話,可是他所說的卻是類近北京話的語音。 例如,不知有多少人知道
&quot;感情&quot; 是 kafmzeeng<font size="+1">? </font> 時下一般的年輕人可不是都說成 kanciin 麼<font size="+1">?</font>
 自認台語說得很好的大學生,最多說成 kanciing。</font> <br>
  <br>
<font face="新細明體"> 我們在聽別人說話的時候,大半心中先有預備,所以說話的人的口音離譜也會瞭解他的意思。 電子儀器的電腦,卻不通融。 
傳進來的聲波轉換成拼字之後,如果在辭彙中找不到應該對應的語辭時,電腦就無法瞭解你所要說的話。 可見,正確的台灣話語音的訓練是使用這一類自動化工具的先決條件。</font>
<br>
<font face="新細明體"> </font> <br>
<font face="新細明體"> 我們的台灣話老師,以及語音學學者在未來的資訊化杜會中所負的任務之重,可由上面的說明中看出來。  大家應有所警惕。</font>
<br>
    <br>
    </p>
<p><b><tt><font size="+2" color="#ff0000">6. 結 論</font></tt></b> <br>
  <br>
<font face="新細明體">
 語言是活的。 它順看杜會環境的變遷及科技文明的演進,不斷地壯大而明確化。 可是一方面,弱勢的語言卻時常面臨看被同化、被瓦解的危機。 現在的合灣人的語言就是這樣的弱勢語言。 如今,除非有識之士及時自覺,以冷靜無私的心懷,努力重建台灣話該有的風貌,建立它的根基,積極推展其教育,否則必逐漸消失於人們記憶之外,而台灣人也就化為沒有自己個性的族群。</font>
<br>
  <br>
<font face="新細明體">
 語言的根基在它的文書法。 沒有語文,則任何語言都會衰弱而消退。 也許有人會想,我們可以使用錄音機來記錄人們的談話,使它永存。 可是被錄音的口語是死的,它不能成長。 以注音記號來代替錄音,也是這樣。 台灣一百年來,口語文學的貧弱,及民眾不會寫出自身的口語的實況,其主因在於少數指導者對注音記號的強硬堅持。 其實,他們本身也因為注音記號之不合理而未曾留下什麼像樣的母語著作。 自知其難則不宜強制於同胞。</font>
<br>
<font face="新細明體"> </font> <br>
<font face="新細明體">
 介紹現代文書法,讓下一代的人們學習,記憶,而應用在日常生活之中,且使他們用以追求真善美的心靈境界,是今天我們台灣人所要為我們族群的未來努力的一重</font>點。
<br>
  <br>
<font face="新細明體">
 二十一世紀是名副其實的資訊時代。 任何事務都離不開電惱,離不開資訊處理。 這時,吾族群該如何自處,乃是我們不得不深慮的課題。</font> <br>
  <br>
<font face="新細明體">
 現代文書法的教育理念是,像英文,法文的教育法那樣,讓小孩在其成長過程中,逐步記憶身邊事物的語辭拼字,能以它來寫作。 我們使用英文來寫信時的順暢,是因為我們已經記憶好那些英文語辭的拼字。 如果要求你使用國際音標記號,用心分析語音來寫英文信件,不知你有那個耐心麼<font size="+1">?
</font> 一百年前,Barclay博士的耐心確是值得敬仰的,可是以後就不再有幾個這樣的台灣人。</font> <br>
<font face="新細明體"> </font> <br>
<font face="新細明體"> 現代文書法將解放台灣人的心靈,使他們可用打字樓,文書處理機或電惱,自由自在地把心裡的話語寫出來。</font> <br>
  <br>
<font face="新細明體">
 筆者四歲起在台南太乎境長老教會學習而使用羅馬白話文到現在已五十六年,對此音標法之長短體會至詳。 筆者擔任長老及大專事工委員多年,確實能將教會所用的羅馬字聖經聖詩讀得既自由且迅速。 可是絕不因為自己擁有此項能力而去阻止台灣話語文的現代化。 這一代所遭遇的不合理,不可議下一代重蹈覆轍。 合理化是現代化的準則。 現在為自身的方便,堅持不合理的音標法,來使吾族群今後的發展受阻,是違背基督徒的良心的。</font>
</p>
<p><font face="新細明體">&nbsp;&nbsp;
我們曾徑以極嚴謹的態度,做了以羅馬音標記號來建立台灣話的電腦化系統的研究。結果也因為那些聲調記號的內碼安排而宣告失敗。&nbsp;
那是極低效率的不符合資訊科技處理原則的東西。&nbsp;
語文的電腦化系統不止於文字記號的展示與印刷,它實以在電腦記憶內部的快速自動處理為中心課題。 它包括自動排序與判斷。 那些調號使這些內部作業成為不可能。</font>
<br>
  <br>
 <font face="新細明體">由我們過去多年來在台灣話之電腦化所下的研究經驗,深知現代文書法才是台灣人要生存在資訊時代的唯一希望。 它自始努力於開發出一套現代化的語文。 那就是明確不含糊的語文。 這項努力的成果,竟使台灣話在拼字文的形態下,成為語意明晰的文明國家語文,也使它在即將到來的資訊世界裡,能用電腦來做自動處理。</font>
</p>
<p><font face="新細明體">
 盼望在國外的台灣人資訊科學家,勿執意於古老漢文或羅馬音標記號法,來著手開始做台語文的電腦化,因為那將是徒勞無功的。 台海人的資訊社會若以現代文書</font>法來建立,則必能迅速達成理想,而使我們的下一代能擠身於現代化民族之列。
<br>
  <br>
<font face="新細明體">
 在大家開始努力要回復母語及鄉土文藝的這個時侯,請相信,台灣話的現代文書法是可與歐美諸文明國家的文書法相併肩的。 台灣話絕對不是沒有救藥的語言。 請以新的信心去努力開發,期待台灣人有光明的未來。
</p>
<hr width="100%">
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<b><font color="#008000"> ( 1989年1月 交 AATL,SanDiego ─
1989年6月22日 刊 台灣公論報 )</font></b></font></p>
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-19 15:04 , Processed in 0.071142 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表