湘里妹子学术网

 找回密码
 注册
楼主: Artvine

[分享]漢語分詞標注、眉注、音標與英文詞意對應程式測試

  [复制链接]
 楼主| 发表于 2003-10-22 18:20:18 | 显示全部楼层
眉注(RUBY)的例子和原始檔:如此簡單
http://artvine.com.tw/cgi-bin/bo ... ow_post&post=34
-----------------------------------Copy & TEST in FRONTPAGE

<font size="+1"><RUBY></p>
<RUBY>
<p></p>

<p>漢<RT>han4</RT></RUBY><RUBY>語<RT>yu3</RT></RUBY><RUBY>分<RT>fen1</RT></RUBY><RUBY>詞<RT>ci2</RT></RUBY><RUBY>標<RT>biao1</RT></RUBY><RUBY>注<RT>zhu4</RT></RUBY><RUBY>及<RT>ji2</RT></RUBY><RUBY>字<RT>zi4</RT></RUBY><RUBY>典<RT>dian3</RT></RUBY><RUBY>連<RT>lian2</RT></RUBY><RUBY>結<RT>jie2</RT></RUBY><RUBY>測<RT>ce4</RT></RUBY><RUBY>試<RT>shi4</RT></RUBY>
发表于 2003-10-22 19:01:12 | 显示全部楼层
大宝兄刚才贴出的国际音标,结果却是乱码

我试了也不行,原以为是字体的支持,但后来发现是字符代码的不同,那些音标是Unicode字符代码,而论坛使用的却是ANSI代码,所以无法正确显示。先将这些音标出处的网址贴出,我再去寻求一下这方面的技术支持,看能否将论坛的默认字符代码更改一下。

http://chinese.pku.edu.cn/bbs/th ... ghlight=&page=3
发表于 2003-10-22 20:06:42 | 显示全部楼层

还得向水电工先生讨教,弄明白这个问题:)

汉han4语yu3分fen1词ci2标biao1注zhu4及ji2字zi4典dian3连lian2结jie2测ce4试shi4


        在水电工先生网站明明是“字词上方眉注拼音”转换,怎么“移植“到这里就变成了“字词后面加注拼音”了?这样就不能显示分词连写了。

        希望能有答复:)


<font size="+1"><RUBY></p>
<RUBY>
<p></p>

<p>漢<RT>han4</RT></RUBY><RUBY>語<RT>yu3</RT></RUBY><RUBY>分<RT>fen1</RT></RUBY><RUBY>詞<RT>ci2</RT></RUBY><RUBY>標<RT>biao1</RT></RUBY><RUBY>注<RT>zhu4</RT></RUBY><RUBY>及<RT>ji2</RT></RUBY><RUBY>字<RT>zi4</RT></RUBY><RUBY>典<RT>dian3</RT></RUBY><RUBY>連<RT>lian2</RT></RUBY><RUBY>結<RT>jie2</RT></RUBY><RUBY>測<RT>ce4</RT></RUBY><RUBY>試<RT>shi4</RT></RUBY>




这是电脑程序语言吧?555~~~看不懂,好麻烦的:P
建议水电工先生在此论坛开开课,保准会有生源的。
俺第一个报名了!
发表于 2003-10-22 20:35:25 | 显示全部楼层
上面水电兄贴出的是HTML代码,由于论坛不支持该代码所以显示的只是代码语言。

    复制文字转贴到论坛只能复制到文字本身,而文字并不包含HTML的语言代码,所以就是前后排列。而假如你复制然后粘贴到Word文档或使用FrontPage在贴出来,那么就能是包含功能代码的内容了。也就是说粘贴到Word文档或FrontPage编辑的网页中就能看到字词上方眉注拼音的效果。
发表于 2003-10-22 20:46:02 | 显示全部楼层

水电工先生真是快活似神仙哟!

水電工 于 2003-10-22 06:22 PM 写道:
這兩天本來想好好寫個說明的,可是一方面忙看技術文獻,
一方面喝酒聽戲賞蓮玩金魚,還要抽空陪美眉談天(這當然
最給它重要);又想先作個例子作實際說明。
但,余生有涯,餘(余)生不多(中文死結A)←

      

        看来水电工先生是个挺会生活挺有情趣的人呢,忙里偷闲尽做些好事情-------喝酒聽戲賞蓮玩金魚,還要抽空陪美眉談天(這當然最給它重要),不知水电工先生喜欢喝什么酒?说来让大家分享分享呀,虽然隔着一个海岸,但酒香可以飘千万里的哟!
     
       听的是什么戏呀?哪个流派的?您一定也会跟着哼哼几句吧?录个音挂到论坛来让朋友们饱饱耳福呀:lol:
     
      赏莲?看来水电工先生一定是有个私家花园之类的住宅了,您的池塘有朱自清先生描写的《荷塘月色》里的那么美吗?

     “陪美眉談天(這當然最給它重要)”此话特中听!呵呵,如此看来水电工先生是个很诚实的性情中人了:-P假如连美眉都不喜欢了,那肯定是个废人无疑的了,哪还能编什么电脑程序哟。 唔,说不定呀,那编程序的灵感还是在“陪美眉談天”时产生的也不一定呢,您说对吧水电工先生?:p

      很希望能跟您交个朋友!假如湘里妹子论坛能有您这么有趣的学者加盟,那简直是论坛所有朋友的福气呢!

      您一定要常来这里喝酒聊天打铁坐坐哟,这里的美眉也有大把呢:-P您去浏览一下会员表就清楚的了!:-P
发表于 2003-10-22 21:36:35 | 显示全部楼层

关(guan1)于(yu2) 爱(ai4)情(qing2)

艾(ai4)青(qing1)


 
这(zhe4)个(ge4) 世(shi4)界(jie4) ,,()
什(shi2)么(yao1) 都(du1) 古(gu3)老(lao3) ;(;)
只(zhi3)有(you3) 爱(ai4)情(qing2)
却(que4) 永(yong3)远(yuan3) 年(nian2)轻(qing1) 。(.)

这(zhe4)个(ge4) 世(shi4)界(jie4) ,,()
充(chong1)满(man3) 了(liao4) 诡(gui3)谲(jue2) ,,()
只(zhi3)有(you3) 爱(ai4)情(qing2)
却(que4) 永(yong3)远(yuan3) 天(tian1)真(zhen1) 。(.)

只(zhi3)要(yao4) 有(you3)了(le5) 爱(ai4)情(qing2) ,,()
鱼(yu2) 在(zai4) 水(shui3)中(zhong1) 游(you2) ,,()
鸟(niao3) 在(zai4) 天(tian1)上(shang4) 飞(fei1) ,,()
黑(hei1)夜(ye4) 也(ye3) 透(tou4)明(ming2) 。(.)

失(shi1)去(qu4) 了(liao4) 爱(ai4)情(qing2) ,,()
断(duan4)了(le5) 弦(xian2) 的(di4) 琴(qin2) ,,()
没(mei2)有(you3) 油(you2) 的(di4) 灯(deng1) ,,()
夏(xia4)天(tian1) 也(ye3) 寒(han2)冷(leng3) 。(.)



       以上是按照风雪里先生提供的方法,先在水电工先生的网站程序里做“字词上方眉注拼音”转换,然后复制粘贴到Word文档再帖到论坛来的,还是变成了“字词后面加注拼音”了。不过也不是先前的模式了,字后拼音带上了括号。
   
      这又是怎么回事儿呢,请问水电工先生?
发表于 2003-10-22 22:30:27 | 显示全部楼层
我方才用FrontPage试了一试,好像也不行,看了看水电兄提供的页面源代码,应该是需要JavaScript语言支持的吧?如果是这样的话,大家都不能很方便地获得眉注的效果,其实用价值的确大打折扣了。

如果单单是需要拼音标注,国内已有很多这样的软件能做到了,推荐一个:
http://www.xlmz.net/forum/viewthread.php?tid=1560

香港也有类似软件:
http://input.foruto.com/cccl/pnm2001se_fh.html
 楼主| 发表于 2003-10-23 10:03:38 | 显示全部楼层
這種RUBY(Mark)不是程式碼,只是網頁標示型態,沒那麼難的。
也與Java Script無關(原始檔看不到的)。
猜想可能是語碼的問題,請試試這個↓
http://artvine.com.tw/cgi-bin/bo ... show_post%26post=34
再把裡面的字COPY到FRONTPAGE的<Nomal>區域。

如果要能在BBS中顯示,只要開放HTM與法和非剛性斷行(Hard)
就可以了(如我的繁簡體示範)。TEST Utf-8→&#464
把BBS cgi的語文包(PHP)改成GBK應該Unicode/big5都沒問題了。
大陸的BBS寫得不錯,但與南韓產品一樣,失之繁複。限制
HTM語法(或使用UBB代換),是出於防止破壞性語法,但我們
目前喜歡把防範的機制寫在CGI中,但讓讀者能盡情使用HTM
語法。

已測試過9種大陸拼音工具(偷懶用的),在繁體Windows下
不能用。
寫網路程式比封裝到PC難度高得多(無法利用使用者PC資源)
;這也是對程式設計者更大的理想與挑戰(有朋友跟我反應,
大陸的PC軟體(or D版)比上網便宜,那是大陸的特殊情況,
我現在思考的是外面市場的情況)

下個小變更:
一、加入本頁標色與字詞替代(Search & Replace in HTM)
二、字詞校正功能(Spell Check)
三、繁簡轉換
四、英日文版
五、拼音/字典查漢字功能(給老外用的)
-----------------------
經過TEST: Utf-8在此BBS果然不行

[ 本贴由 水電工 于 2003-10-23  10:05 最后编辑 ]
发表于 2003-10-23 10:23:17 | 显示全部楼层

按水电工先生指示测试得到的结果是:

先进入 :http://artvine.com.tw/cgi-bin/bo ... show_post%26post=34
再把裡面的字COPY到FRONTPAGE的<Nomal>區域,于是就得到了以下结果:

han4语yu3分fen1词ci2标biao1注zhu4及ji2字zi4典dian3连lian2结jie2测ce4试shi4

“字词上方眉注拼音”还是变成了“字词后面加注拼音”了:cool:

不知问题在哪里?我可是电脑盲一个,只有请教水电工先生了:-P



:-O
 楼主| 发表于 2003-10-23 10:38:39 | 显示全部楼层

re

您貼在這兒當然不行ㄚ(沒開放HTM),用FRONTPAGE
的Preview看看吧!
此BBS版是否這個↓
http://www.phpbb.com/

NOTE:PHP極易受結構性語法侵入
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-28 05:34 , Processed in 0.063156 second(s), 11 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表