阅读:《NLP进步将如何改变搜索体验》

阅读 Quarterback 29℃ 0评论

《NLP进步将如何改变搜索体验》

  • 评价搜索引擎的两个重要方面:
    • 智能程度
      • 理解用户意图
      • 查准率和查全率
    • 自然程度
      • 检索流程和结果都流畅自然
  • 一个典型的搜索引擎工作流程及架构
    • 用户输入:Header&Search Box:
      • 用于用户输入Query
    • 系统处理搜索:Context&Query Understanding:
      • 搜索引擎首先要理解Context,就是什么人用了什么样的设备、在什么地点输入这样的Query
      • 其次要理解用户的意图,就是用户输入这个Query是想搜什么
    • 搜索结果展现:Ten Blue Links、Super Fresh、Instant Answer、Task、Social Pane、广告
      • Ten Blue Links即十个最重要的匹配文档
      • Super Fresh指新鲜的一些事物或者文档,比如新闻的有关结果
      • Instant Answer就是涉及到天气、股票、交通等垂直领域的信息
      • Task指的是基于搜索结果的页面上还可能要做新的任务,比如订票
      • Social Pane是列出相关的微信、微博或LinkedIn的各种信息
  • 为了支持上述检索,需要进行事先的一些离线工作:
    • Crawler(抓取数据)
    • Index(建立倒排索引)
  • 搜索引擎中可以用到很多NLP的技术:

640_5

  • 自然语言技术覆盖的领域包括:
    • NLP 基础
      • 词的表示
        • 比如现在热门的Word Embedding
        • 词的表示包括上下文无关的表示和上下文有关的表示,前者就是静态的Word Embedding,后者现在一般使用各种预训练模型,根据当前的句子来体现一个词在特定上下文的的语境里面该词的语义表示。
        • 同样一个词,在不同的语境下,其语义表示也不一样。
        • 基于词的表示,我们就可以做很多应用,比如语言模型、分词、语言模型、句法语义分析、篇章分析、等等,这些都是NLP的基础
      • 语言模型、分词、语言模型、句法语义分析、篇章分析、等等
    • NLP 核心技术
      • 基于 NLP 基础,我们又有很多 NLP 的核心技术,包括机器翻译、问答、信息检索、信息抽取、对话、知识工程,还有自然语言生成、推荐系统,等等
    • NLP 应用
      • 基于 NLP 核心技术,我们就可以把 NLP 用在一些具体的应用中,比如搜索引擎、客服、商业智能和语音助手
      • 为了完成这些任务还需要很多底层支撑技术,包括用户画像建模、用于实现个性化的推荐技术、大数据能力、计算能力、机器学习和深度学习的能力、知识库、常识及推理的能力。
  • 深度学习对自然语言技术的影响:
    • 深度学习先后对图像、语音、自然语言这些领域都产生了重要的影响。其中,深度学习对自然语言的影响主要体现在以下 6 个方面:
      • 1. 端到端训练(End-End Training)
      • 2. 语义表示(Embedding)和预训练模型(Pretrained Model)
      • 3. Attention(注意力模型)
      • 4. 句子的编码方法(RNN/LSTM/GRU/Transformer)
      • 5. 编码 – 解码模型(Encoder-Decoder)
      • 6. 强化学习
  • 自然语言技术的进展和趋势:
    •  问答技术(QA)
    • 多语言处理能力(Multi-lingual capability)
    • 多模态搜索
    • 机器阅读理解
    • 个性化推荐
  • 自然语言处理未来比较重要的研究课题包括:
    • 知识获取和知识表示
    • 新的学习方法
    • 上下文相关的建模(Context Modeling)
    • 新的搜索模态
    • 搜索结果的生成和摘要
    • 信息流



喜欢 (0)or分享 (0)
Quarterback.cn 打赏作者
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址