【词典】原始文本文件格式说明V2
注:因为之前( http://bbs.3miao.net.cn/thread-46854-1-1.html )考虑不周到,所以又加了说明,有些小变动。苗语词典软件需要词典数据,这些数据在软件成型后会以内部格式存储在数据文件中。但手工把词一个一个录入进数据文件会相当不方便,所以我制定出一个原始的文本文件格式,方便录入和编辑修改。我会专门编写一个转换工具,把该文本文件转换为词典软件的内部格式。
词典原始文本文件的格式比较简单:(蓝色字体表示修改了的内容;红色字体表示增加的内容)
1、每行一个词、一个例句、或对于词的详细解释(目前暂只有汉语);
2、词包括单字词及多字词;
3、词或例句都是苗文在前,汉字在后;
4、一个苗语词后面可跟多个汉语词,以分号或逗号分隔;
5、一个苗语例句后只能跟一个汉语例句;
6、词顶头写,前面不留任何其它字符;
7、词的详细解释缩进,以一个或多个空格符或制表符打头,紧跟在词的下面。可以没有;
8、例句缩进,以一个或多个空格符或制表符打头;
9、多义词可以分多行写,也可以用分号或逗号分隔,在同一行写;
示例: (行尾的斜体灰字是注释,不是词典数据)
hob 天 (单字词)
Gid hfud ngit hob. 抬头望天。 (例句)
Bet pot sul lox bob. 炮声响如天崩。 (例句)
hob 电 (多义词可以多行)
云层中产生火光放电现象 (详细解释)
lif hob 闪电 (例句)
hob dib 雷击,雷打 (多字词。多义可以用逗号或分号分开)
Hob dib seix dangl nongx jangx dent gad. 雷打也等吃完一顿饭(意为再急也得把饭吃完)。 (例句)
Dail det yens hob dib. 树子被雷击。 (例句) 跟斗学习。 这样要得。 辛苦了 楼主之才,可敬可佩。:lol 看似简单,不容易啊。
具体了解了一下,似乎要实现英汉苗互译,又要具备几大方言相互识别。没有规划好,目前录入的字库后期将会重头再来。
例如:一个字库中目前最好按一点格式录入,方便后期导入统。
字库表.DBF
第一关键字代码 第二关键字代码 苗语 汉语 英语 例句 备注
1 短语/词句/名词 X X X X 1代表川黔滇
2 短语/词句/名词 X X X X 2
总的来说感觉不容易啊,现在思路不清晰还找不到门路呢,关注中。 看似简单,不容易啊。
具体了解了一下,似乎要实现英汉苗互译,又要具备几大方言相互识别。没有规划好,目 ...
Hmoob之声 发表于 2010-3-16 08:06 http://bbs.3miao.net.cn/images/common/back.gif
谢谢杨富关心!:handshake
肯定不会很容易的。你做软件开发吗?那就请加入开发队伍吧!等我把设计思路理出来后,大家一起交流讨论。 来学习!各位辛苦,软件方面你们去头痛吧!杨富兄弟说的很对,避免重复工作,先把思路理好。 来学习!各位辛苦,软件方面你们去头痛吧!杨富兄弟说的很对,避免重复工作,先把思路理好。
龙王 发表于 2010-3-16 11:38 http://bbs.3miao.net.cn/images/common/back.gif
整个软件系统的架构设计及公共数据结构设计,我当仁不让了 :lol 不过为避免个人走的路有问题,会拿出来跟同行们讨论交流的。有可能不在论坛公开讨论,这也许需要作为苗族人的知识产权来保护的。
页:
[1]
