博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
人工智能基准(Benchmarking)再思考
阅读量:4225 次
发布时间:2019-05-26

本文共 276 字,大约阅读时间需要 1 分钟。

来源:专知

本文多图,建议阅读5分钟

本文介绍我们在人工智能(特别是在自然语言处理)中进行基准测试的方式时所做的工作。

当前人工智能中的基准测试范式存在许多问题:基准很快饱和,容易过度拟合,包含可利用的注释器工件,评估指标不清晰或不完善,并且不能衡量我们真正关心的东西。我将谈谈我在尝试重新思考我们在人工智能(特别是在自然语言处理)中进行基准测试的方式时所做的工作,包括对抗性的NLI和模因数据集,以及最近推出的Dynabench平台。

https://nlp.stanford.edu/seminar/details/douwekiela.shtml

转载地址:http://noyqi.baihongyu.com/

你可能感兴趣的文章
T-SQL中的聚合函数中的SUM()函数与AVG函数()
查看>>
T-SQL中的聚合函数(二)
查看>>
分组查询
查看>>
2021-06-04
查看>>
最长无重复子数组
查看>>
Dual-Primal Graph Convolutional Networks 对偶-原始图卷积神经网络
查看>>
GoGNN: Graph of Graphs Neural Network for Predicting Structured Entity Interactions
查看>>
Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks
查看>>
DiffPool: Hierarchical Graph Representation Learning with Differentiable Pooling
查看>>
MuchGCN:Multi-Channel Graph Convolutional Networks
查看>>
kernel_size为1的卷积核与全连接层的关系
查看>>
STRATEGIES FOR PRE-TRAINING GRAPH NEURAL NETWORKS
查看>>
PAT_A 1010. Radix (25)
查看>>
PAT_A 1005. Spell It Right (20)
查看>>
PAT_A 1012. The Best Rank (25)
查看>>
PAT_A 1013. Battle Over Cities (25)
查看>>
PAT_A 1015. Reversible Primes (20)
查看>>
SetWindowLong函数介绍
查看>>
百度云cdn,bos设置
查看>>
[chrome]好用的chrome Json 格式化插件
查看>>