7

321,京东言犀×NLPCC 2022挑战赛开赛!

 2 years ago
source link: https://segmentfault.com/a/1190000041583894
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

321,京东言犀×NLPCC 2022挑战赛开赛!

随着互联网的高速发展带来了信息过载问题,给人们获取和理解所需要的信息带来了障碍。因此产生许多精华概要式服务模式,例如罗振宇的60秒语音、快速讲书、快速讲电影等等,都是通过提炼核心信息服务受众。近年来AI技术取得了巨大的进步,尤其是在自然语言处理的文本生成领域,具有十分广泛的产业化应用前景,不仅可以基于文本,还可以基于图片等多模态信息,凝练生成优美的文案。2020年OpenAI发布的1750亿参数的GPT-3,其写作水平能够与人类媲美。

京东发现好货-西门子文案

京东发现好货-海蓝之谜文案

京东已在自身业务中大规模应用了文本生成技术,可以在短时间内为用户撰写精美的商品摘要文案,并根据用户喜好推荐给用户“种草”,京东言犀基于领域预训练K-PLUG的商品文案生成模型已经覆盖了京东的3000+个三级品类,人工审核通过率90%以上,累计生成文案30亿字,应用于京东发现好货频道、搭配购、AI直播带货等,商品摘要文案反映了商品最独特的差异化价值,最大限度地促进用户的购买,累计带来超过3亿元GMV。此外,言犀还可以拥有写诗、写春联、书法创作等多种AI能力。

京东发现好货-卧式冰箱文案

商品摘要文案的挑战主要来源于三个方面,首先,信息的来源丰富,包含标题、商品规格、产品海报等信息;其次,需要处理多模态和结构化的信息,包含文字和图像各类信息,以及商品规格参数等结构化信息;再次,AI系统必须要足够智能,能够充分挖掘商品的卖点信息,并在合适的时间,千人千面的推荐给恰当的用户。

基于此,京东言犀开放了京东真实场景的脱敏数据,携手NLPCC 2022举办多模态商品摘要挑战赛。该任务旨在为一个指定商品生成一段凝练的文本摘要,给定的输入包括商品详细文本描述、商品知识图谱和商品图片。以下将介绍该任务的定义、数据集和评测方法。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK