• 369出行APP开通绿色出行卡充值业务 2018-06-22
  • 曾任吉林省地方税务局局长的王克成涉嫌巨额受贿被提起公诉 2018-06-22
  • 1至4月沪苏浙在皖投资亿元以上项目1579个 2018-06-22
  • 广西将开展精准帮扶“三方”见面活动 2018-06-22
  • 阿里通信发布云对讲解决方案 2018-06-22
  • 西部网(陕西新闻网)www.cnwest.com 2018-06-22
  • 贾浩宇:要做京津冀产业疏导的示范项目 2018-06-22
  • 恶性肿瘤的原因竟是它!超过50岁半年查个体 2018-06-22
  • 青山藏有好风景,丽水写出美文章——浙江丽水绿色发展观察 2018-06-21
  • 我们完成的,不只是一部电影 2018-06-21
  • 紫光阁中共中央国家机关工作委员会 2018-06-21
  • 2017江阴新年音乐会演绎文明城市“光明行” 2018-06-21
  • 合肥经贸旅游学校--安徽频道--人民网 2018-06-21
  • 共青团十八大官方网站上线 2018-06-21
  • 权威发布|2018年5月阜阳、宣城驾校合格率通报 2018-06-21
  • ?

    26 04月

    SEO如何学懂关键词分词技术?

    当前位置: 韶山SEO > seo技巧 > SEO如何学懂关键词分词技术?
    分类: seo技巧 作者:蔡江SEO 围观 次

    韶山SEO shaoshanseo.brittany-pictures.com   seo如何做好分词技术?如何分词能够满足搜索引擎?什么是百度分词?SEO是否有接触一些分词组件呢?从百度分词不难看出,分词是根据词义、词语、词频的方式,来决定搜索引擎对词语的捕捉。

    SEO如何学懂关键词分词技术?

      中文分词一般为:字符串匹配、统计分词、词义分词。

      第一种:字符串匹配分词

      这种分词技术又称之为机械分词方法,直白说就是扫描字符串,查询页面中字符串的子串和词相同,则视为匹配,该类分词一般会加入启发式规则,例如:正向/逆向最大化匹配、长词优化等方法。

      优势:匹配速度快,实现过程简单

      劣势:难以区分歧义词,匹配不精准

      案例:庖丁解牛分词器就是基于字符串匹配的分词

      例子:成都网络推广公司

      “成都、成都网、推广、公司”“成都、推广网、公司”

      正向最大值匹配:把关键词从左到右进行匹配

      逆向最大值匹配:把关键词从右到左进行匹配

      最短路径分词法:搜索引擎提取文中词数最小值

    SEO关键词分词技术

      第二种:统计分词

      这类分词基于人工标注的词性和统计特征,对中文进行建模,即根据观测到的数据(标注好的语料)对模型参数进行估计,即训练。 在分词阶段再通过模型计算各种分词出现的概率,将概率最大的分词结果作为最终结果。常见的序列标注模型有HMM和CRF。

      优点:很好处理歧义和未登录词问题,效果比基于字符串匹配效果好

      缺点:需要大量的人工标注数据,较慢的分词速度

      相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成词的可信度。

      可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息。定义两个字的互现信息,计算两个汉字X、Y的相邻共现概率。互现信息体现了汉字之间结合关系的紧密程度。

      第三种:词义分词

      词义分词法:通过机器语音判定的分词方法,主要用以处理歧义现象。

    文章作者:韶山SEO
    文章标题:SEO如何学懂关键词分词技术?
    本文地址:http://shaoshanseo.brittany-pictures.com/jiqiao/318.html

    相关文章:

    ?
    返回顶部
    SEO | 博彩娱乐 | 郴州网站优化 | 免费小说网 | 免费电影 | 榆林SEO | SEO优化 | 网上哪个赌博网站好 | 全讯网5123备用网址 | 澳博开户 | 蒙特卡罗赌城 | 博彩在线 | 郴州seo | 澳门博彩在线 | 郴州seo优化 |