分词技术

如果问现在最兴的技术是那个的话.百分之百的人都会说.搜索引擎技术.搜索技术中有一个非常重要的技术就是分词技术
分词,就是把句子分成一个个词。这个对英语或相似的语言来说。很简单,因为一个英语单词就是一个词。但是中文,日文,韩语等象形文字却不是。如:李广东是中国人。那么就分成了李广东/是/中国/人。这是我们人日常的理解。但是电脑不明白。它可能把它分成/李/广东/是/中国/人。下面介绍的是由河北理工大学经管学院吕震宇根据Free版ICTCLAS(中科院牛人张华平写的)中文分词代码。当然。俺也没有完全看懂。所以找到代码,和大家一起研究。(NET2。0)

附件附件:

您所在的用户组无法下载或查看附件