伍佰目录 短网址
  当前位置:海洋目录网 » 站长资讯 » 站长资讯 » 文章详细 订阅RssFeed

闲聊结构化预测(structured learning)【这是一类问题】

来源:本站原创 浏览:101次 时间:2022-05-07

我们首先需要明白什么是结构化预测。好,开始:

在机器学习过程中,对数据的拟合其实就是在找一个拟合函数f:

比如对于回归问题(Regression)来说,这个函数输出一个标量(scalar)、


对于分类问题(Classification)来说,这个函数输出一个类别(一个one-hot的向量)

但是有一类的预测,它并不是输出一个标量或者一个类别,而是输出些有结构的输出,比如,一个序列,一个句子,一个图,一颗树...


那么我们将输出这些结构化结果的过程叫做结构化预测(Structured Prediction)

Example

这部分,我们对于Output Sequence和Output Matrix举一些我们常见的例子,昨天听了车万翔老师的talk,对于nlp的基础任务分词,词性标注,parsing,等等内容都可以归结为结构化预测,目前还没有拿到slides,之后拿到了会更新。

Output Sequence

对于机器翻译(Machine Translation),输入是一个语言序列,输出是另一种语言序列:

对于语音识别(Speech Recognition),输入是一段音频,输出是识别的文字序列:

对于聊天机器人(chat-bot)

输入是user的话序列,输出是机器人回复的response序列:

Output Matrix

对于image to image任务来说:

输入是一个图片,输出是另一个图片(matrix像素点)

Text to image任务

输入是一段文字描述,输出是图片(matrix像素点)

Why Structured Learning Challenging

首先给出李宏毅老师ppt,解释如下:

在分类任务中,每一个类别都有一定的样例Sample,但是在结构化预测中,如果把每一个output当做一个类别来看的话,输出空间就非常大了,因为测试数据的输出很有可能都是训练数据没有见过的,什么意思呢?

如果把每一个sequence当做一个类别的话,完全相同的sequence会比较少,那么造成每一个类别的训练样例很少,而且测试数据输出不一定在训练数据中出现过,比如是对话任务的话,一个问题的回复很可能在训练数据没有出现过,训练数据相同问题的回复可以换了一种表达了。

比如说:

训练数据中,对话是input:哈工大的地址在哪? output:哈工大位于哈尔滨教化街29号

将这个回复当做一个类别看待的话。

而测试数据的样本是intput:哈工大的地址在哪?output:哈尔滨教化街29号是哈工大的地址。

那么这两个output的意思一样,但是是不同的输出,这样就需要机器自己有一些额外的能力,不然你在训练数据中没有见过测试数据的output,就很难正确生成。这里是解释一下为什么结构化预测问题中output space巨大的问题。

这是结构化预测的一个难点。


  推荐站点

  • At-lib分类目录At-lib分类目录

    At-lib网站分类目录汇集全国所有高质量网站,是中国权威的中文网站分类目录,给站长提供免费网址目录提交收录和推荐最新最全的优秀网站大全是名站导航之家

    www.at-lib.cn
  • 中国链接目录中国链接目录

    中国链接目录简称链接目录,是收录优秀网站和淘宝网店的网站分类目录,为您提供优质的网址导航服务,也是网店进行收录推广,站长免费推广网站、加快百度收录、增加友情链接和网站外链的平台。

    www.cnlink.org
  • 35目录网35目录网

    35目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向35目录推荐、提交优秀网站。

    www.35mulu.com
  • 就要爱网站目录就要爱网站目录

    就要爱网站目录,按主题和类别列出网站。所有提交的网站都经过人工审查,确保质量和无垃圾邮件的结果。

    www.912219.com
  • 伍佰目录伍佰目录

    伍佰网站目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向伍佰目录推荐、提交优秀网站。

    www.wbwb.net