Facebook使用35亿张公共Instagram照片来训练AI
至顶网软件频道消息:Facebook使用Instagram上数十亿公开的照片来训练人工智能(AI)对图像自行分类的算法,这些照片包含Instagram用户提供的17000个井号标签。
训练计算机做人们通常做的事情——例如识别照片中的内容——通常需要为其提供大量数据。但这些数据必须由人类进行标记,而这是需要花费时间和成本的。Facebook开发了一种新技术,让员工不必坐下来对每张图片进行分类。
本周在美国加州圣何塞举行的Facebook F8大会上,Facebook首席技术官Mike Schroepfer表示:“在计算机视觉领域取得进步的最大限制因素——就和很多人工智能领域一样——就是我们几乎完全依赖于手动标记的、人为组织的数据集。这意味着,如果一个人没有花时间对图像中特定的事物做标记,即使是最先进的计算机视觉系统,也无法在运行时检测到该事物,因为系统在训练集中并没有看到这个事物。”
Schroepfer补充道:“我们已经开发了一些具有突破性的技术,可以以前所未有的规模对公开标签图像进行处理。我们已经使用一套公开的35亿张图像进行训练。”
根据Wired的说法,Instagram数据集比Google用来训练图像算法的巨大缓存还要大10倍。
Facebook应用机器学习部门工程总监Srinivas Narayanan补充说:“我们现在打造了世界上最好的计算机视觉系统,它在ImageNet上获得了84.5%的最高分数。ImageNet是一个广泛用于基准测试的数据集。”
Schroepfer说,Facebook已经在其平台上使用计算机视觉系统来发现需要删除的“坏内容”——可能包括裸体和与恐怖主义有关的内容。
G M T检测语言 世界语 中文简体 中文繁体 丹麦语 乌克兰语 乌兹别克语 乌尔都语 亚美尼亚语 伊博语 俄语 保加利亚语 僧伽罗语 克罗地亚语 冰岛语 加利西亚语 加泰罗尼亚语 匈牙利语 南非祖鲁语 卡纳达语 印地语 印尼巽他语 印尼爪哇语 印尼语 古吉拉特语 哈萨克语 土耳其语 塔吉克语 塞尔维亚语 塞索托语 威尔士语 孟加拉语 宿务语 尼泊尔语 巴斯克语 布尔语(南非荷兰语) 希伯来语 希腊语 德语 意大利语 意第绪语 拉丁语 拉脱维亚语 挪威语 捷克语 斯洛伐克语 斯洛文尼亚语 斯瓦希里语 旁遮普语 日语 格鲁吉亚语 毛利语 法语 波兰语 波斯尼亚语 波斯语 泰卢固语 泰米尔语 泰语 海地克里奥尔语 爱尔兰语 爱沙尼亚语 瑞典语 白俄罗斯语 立陶宛语 索马里语 约鲁巴语 缅甸语 罗马尼亚语 老挝语 芬兰语 苗语 英语 荷兰语 菲律宾语 葡萄牙语 蒙古语 西班牙语 豪萨语 越南语 阿塞拜疆语 阿尔巴尼亚语 阿拉伯语 韩语 马其顿语 马尔加什语 马拉地语 马拉雅拉姆语 马来语 马耳他语 高棉语 齐切瓦语 | 世界语 中文简体 中文繁体 丹麦语 乌克兰语 乌兹别克语 乌尔都语 亚美尼亚语 伊博语 俄语 保加利亚语 僧伽罗语 克罗地亚语 冰岛语 加利西亚语 加泰罗尼亚语 匈牙利语 南非祖鲁语 卡纳达语 印地语 印尼巽他语 印尼爪哇语 印尼语 古吉拉特语 哈萨克语 土耳其语 塔吉克语 塞尔维亚语 塞索托语 威尔士语 孟加拉语 宿务语 尼泊尔语 巴斯克语 布尔语(南非荷兰语) 希伯来语 希腊语 德语 意大利语 意第绪语 拉丁语 拉脱维亚语 挪威语 捷克语 斯洛伐克语 斯洛文尼亚语 斯瓦希里语 旁遮普语 日语 格鲁吉亚语 毛利语 法语 波兰语 波斯尼亚语 波斯语 泰卢固语 泰米尔语 泰语 海地克里奥尔语 爱尔兰语 爱沙尼亚语 瑞典语 白俄罗斯语 立陶宛语 索马里语 约鲁巴语 缅甸语 罗马尼亚语 老挝语 芬兰语 苗语 英语 荷兰语 菲律宾语 葡萄牙语 蒙古语 西班牙语 豪萨语 越南语 阿塞拜疆语 阿尔巴尼亚语 阿拉伯语 韩语 马其顿语 马尔加什语 马拉地语 马拉雅拉姆语 马来语 马耳他语 高棉语 齐切瓦语 |
选项 : 历史 : 反馈 : Donate | 关闭 |