专利名称:文本特征提取策略制定方法及装置、文本分类方法
及装置
专利类型:发明专利
发明人:姜赢,王进,彭鸽,刘思培,胡晨申请号:CN201010120134.9申请日:20100220公开号:CN102163190A公开日:20110824
摘要:本发明公开了一种自适应文本分类方法。该方法包括步骤:将策略数据库中的文本特征提取策略之一映射到基于文本特征的文本分类器,并对于待分类语料进行文本分类;当所述策略数据库中的任意一个文本特征提取策略均不适用于所述待分类语料时,对于所述待分类语料进行全局样式分析,得到全局样式分析结果;对于经过所述全局样式分析的所述待分类语料进行局部样式分析,得到局部样式分析结果;将所述全局样式分析结果及所述局部样式分析结果整合成文本特征提取策略,并存储到策略数据库中;将所述文本特征提取策略映射到基于文本特征的文本分类器,并进行所述待分类语料的文本分类。
申请人:三星电子(中国)研发中心,三星电子株式会社
地址:210008 江苏省南京市中山路268号汇杰广场8楼
国籍:CN
代理机构:北京铭硕知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务