湘里妹子学术网

 找回密码
 注册
楼主: Artvine

[分享]漢語分詞標注、眉注、音標與英文詞意對應程式測試

  [复制链接]
 楼主| 发表于 2005-3-7 01:36:32 | 显示全部楼层
由於更換主機,以上功能都改置為:

汉语分词标注及字典连结测试(GB)
http://artvinedata.com/seggb.htm

汉语分词标注测试(GB/只作分詞和注音)
http://artvinedata.com/markgb.htm

漢語分詞標注及字義連結測試(Big5)
http://artvinedata.com/segbig5.htm
发表于 2005-3-7 09:31:23 | 显示全部楼层

玩玩看:)

古罗马 时代 , 每年 2 月 15 日 是 祭祀 畜 的 牧 神 节 (Lupercalia) , 这个 传统 是以 祭拜 活动 求人 、 畜 、 土地 来年 兴旺发达 。 到了 14 世纪 , 这一 古老 民俗 逐渐 消失 , 转而 被 充满 浪漫 天才 者 演变 为 情人 、 伴侣 互 表 爱心 的 日子 。 有趣 的 是 , 西方 情人节 恰 与 中国 农历 新年 元宵节 的 日子 相近 , 中国 民俗 是 在 赏 花灯 猜谜 语 之 同时 找寻 意中人 , 也可 算是 月老 节 , 真可 谓 人生 乐事 中外 如是 。


--------------------------------------------------------------------------------
古罗马 [gu3 luo2 ma3] /ancient Rome/
时代 [shi2 dai4] /age/era/epoch/period/
每年 [mei3 nian2] /every year/each year/yearly/
月 [yue4] /moon/month/
日 [ri4] /Japan/day/sun/date/day of the month/
是 [shi4] /is/are/am/yes/to be/
畜 [xu4] /to raise (animals)/
的 [di4] /aim/clear/
牧 [mu4] /shepherd/
神 [shen2] /God/unusual/mysterious/soul/spirit/divine essence/lively/spiritual being/
节 [jie2] /festival/section/temperate/point/part/
这个 [zhe4 ge4] /this/
传统 [chuan2 tong3] /tradition/
活动 [huo2 dong4] /activity/exercise/behavior/
土地 [tu3 di4] /land/territory/
来年 [lai2 nian2] /next year/the coming year/
到了 [dao4 le5] /in (a past time)/there were/
世纪 [shi4 ji4] /century/
古老 [gu3 lao3] /ancient/old/age-old/
逐渐 [zhu2 jian4] /gradually/
消失 [xiao1 shi1] /disappear/fade away/
被 [bei4] /by (marker for passive-voice sentences or clauses)/quilt/blanket/to cover/to wear/
充满 [chong1 man3] /full of/brimming with/very full/permeated/
浪漫 [lang4 man4] /romantic/
天才 [tian1 cai2] /talent/gift/genius/talented/gifted/
者 [zhe3] /-ist, -er (person)/person (who does sth)/
演变 [yan3 bian4] /to develop/to evolve/
为 [wei4] /because of/for/to/
伴侣 [ban4 lu:3] /companion/mate/partner/
互 [hu4] /mutual/
表 [biao3] /surface/exterior/to watch/to show/express/an example/a list or table/a meter/a watch/chart/external/
日子 [ri4 zi5] /a (calendar) date/days of (someone's) life/day/date/
有趣 [you3 qu4] /interesting/fascinating/amusing/
西方 [xi1 fang1] /the West/the Occident/Western countries/
恰 [qia4] /exactly/just/
与 [yu4] /take part in/
中国 [zhong1 guo2] /China/Chinese/
农历 [nong2 li4] /the traditional Chinese calendar/the lunar calendar/
新年 [xin1 nian2] /New Year/
元宵节 [yuan2 xiao1 jie2] /the Lantern Festival, January 15 on the lunar calendar/
相近 [xiang1 jin4] /close/similar to/
在 [zai4] /(located) at/in/exist/
赏 [shang3] /enjoy the beauty of/give/
语 [yu4] /tell to/
之 [zhi1] /(literary equivalent of 的)/(subor. part.)/him/her/it/
同时 [tong2 shi2] /at the same time/simultaneously/
算是 [suan4 shi4] /considered to be/at last/
谓 [wei4] /speak of/
人生 [ren2 sheng1] /(n) life/
发表于 2005-3-7 09:33:59 | 显示全部楼层
闺情 (唐)李端

月落星稀天欲明,孤灯未灭梦难成。
披衣更向门前望,不忿朝来鹊喜声。



guī 情qíng (( 唐táng )) 李lǐ端duān

月yuè落luò 星xīng 稀xī 天tiān 欲yù 明míng ,
孤gū 灯dēng 未wèi灭miè 梦mèng 难nán 成chéng 。
披pī 衣yī 更gèng向xiàng 门mén前qián 望wàng ,
不bù忿fèn 朝cháo 来lái 鹊què 喜xǐ 声shēng 。

---------------------------------------------------------------------------------------------
问题:复制结果来论坛的时候“闺”字不见了!试了两次都一样!
发表于 2005-3-7 10:00:38 | 显示全部楼层
传说一

  相传当时的暴君强迫年青男人入伍,男士们为了逃避兵役,便以结婚为借口。暴君一怒之下,下令禁止结婚,甚至不准谈情说爱,以强迫青年男子加入军队。

  华伦泰对此深表同情,冒死为爱侣秘密主持婚礼。后来事情泄露,华伦泰被捕处死。世人为了纪念华伦泰的英勇行为,奉他为情侣的守护神,并将他的殉难日——2月14日定为“圣华伦泰日”(Saint Valentien),经过多年流传,变为今天的情人节。

chuánshuō yī

xiāngchuán dāngshíde bāojūn qiángpò niánqīng nánrén rùwǚ , nánshì mén wèile táobì bīngyì , biàn yǐ jiéhūn wèi jièkǒu . bāojūn yīnu4zhīxià , xiàlìng jìnzhǐ jiéhūn , shènzhì bùzhǔn tánqíngshuōài , yǐ qiángpò qīngnián nánzǐ jiārù jūnduì .

huálúntài duìcǐ shēnbiǎotóngqíng , māosǐ wèiài lǚ mìmì zhǚchí hūnlǐ . hòulái shìqíng xièlòu , huálúntài bèibǔ chùsǐ . shìrén wèile jìniàn huálúntài de yīngyǒng xíngwèi , fèng tā wèi qínglǚ de shǒuhùshén , bìngjiāng tāde xùnnán rì - - 2 yuè 14 rì dìngwèi " shèng huálúntài rì " (Saint Valentien) , jīngguò duōnián liúchuán , biànwèi jīntiān de qíngrénjiē .
发表于 2005-3-7 10:05:20 | 显示全部楼层

???

有一项结果出不来:只要分词就好:not::not::not:
 楼主| 发表于 2005-3-7 12:18:24 | 显示全部楼层
闺guī 情qíng
有一项结果出不来:只要分词就好→哪一項呢?
发表于 2005-3-7 12:21:19 | 显示全部楼层
“闺”在您的程序转换里能显示,但复制到论坛来就只能显示拼音,汉字复制不进来,我是说整篇复制,不是单独复制“闺情”一个词。

这一项:→“只要分词就好”,在用以下程序时无法显示:
漢語分詞標注及字義連結測試(Big5)
http://artvinedata.com/segbig5.htm
发表于 2006-4-10 17:24:49 | 显示全部楼层

太大了!!

真不错!!
发表于 2006-4-28 00:58:48 | 显示全部楼层
  造字是没有希望的,因为一个人的机器里造出一个样,没有标准化。潘悟云的字体从IPAPANADD到IPAPANNEW的转变,可以看出标准是多么重要。除了汉语几个特别的音标外,IPAPANNEW中已经完全使用Unicode的编码点,而不是像IPAPANADD中的只占用八位ASCII的256个编码点。那个字体是我在侯精一的《汉语方言音档》上面发现的,不知道各位有没有用过。
 楼主| 发表于 2006-4-29 11:59:28 | 显示全部楼层
歡迎各位指教!這個程式很久沒動,看來最近改改看。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-5-5 18:38 , Processed in 0.064299 second(s), 12 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表