4分钟阅读时间 (869字)

AI生成的替代文本

2024---JCM-ai-alt

事事都有其时。当前的趋势是使用生成式AI和LLM(大型语言模型)做任何事情,但我们还没有达到那个阶段。虽然技术上不准确,但我将在本文中将其称为AI。

描述图像

现在有许多工具和应用程序声称能够使用AI用文字描述图像。表面上看,这会使它们成为理想的工具,您可以利用它为网站上的每张图像创建替代文本描述,使您的网站对所有人更加可访问和易用。但事实上,如果没有上下文,描述就像一个巧克力茶壶一样无用。

什么是替代文本?

替代(Alt)文本用于解释文档或网页中图像的目的。屏幕阅读软件将其读给用户听,搜索引擎对其进行索引,如果图像无法加载,它将出现在页面上。

网络内容可访问性指南(WCAG)要求将替代文本作为其第一项成功标准(SC)“非文本内容”的一部分。为了满足这一标准,文本替代品必须服务于与图像相同的“等效目的”

为了等效,替代文本必须在网站的上下文中准确和适当地描述。换句话说,在两个不同的页面或网站上使用的相同图像通常需要不同的替代文本。

向前迈出一步,向后退两步

使用AI,您现在可以确保您的网站上的所有图像都将有一些文本在描述字段中,并且您的网站将通过任何自动化的可访问性测试,检查图像描述(替代文本)的存在。但就像巧克力茶壶一样,生成的描述完全无用,因此将无法通过“现实世界”的可访问性和用户测试。

在测试中,我检查的所有工具都能以不同程度的细节和准确性提供图像的描述。然而,它们描述的是图像,而不是整个内容的上下文。乍一看,工具看起来不错,但当你尝试使用它时,一切都会崩溃。

当人工智能不够智能时

当你要求AI描述图片时,它可能会脱离上下文描述图片,或者提供的信息水平较低,导致图片在你使用时准确性降低,相关性减弱。

示例 - 用法 - 没有上下文

图片来源:Jordan Reay - 温布利体育场,CC0

AI生成的无上下文Alt文本:从空中俯瞰一个大型、拥挤的体育场,场地上正在进行橄榄球比赛。

页面上关于大型体育场使用的手写Alt文本:温布利体育场如此之大,以至于像橄榄球这样的小运动无法填满看台。

页面上关于企业赞助的手写Alt文本:温布利体育场的中间层是空的,因为它是为企业赞助商预留的,他们只想看足球。

页面上关于场地质量的手写Alt文本:橄榄球比赛结束后,温布利体育场的草地场地处于完美状态。

示例用法 - 信息过多

图片来源:Amie Fedora,CC-ND-2

AI生成的无上下文Alt文本:一只手拿着一个带叶子的红苹果,背景是绿草、树木和堆叠的木箱。

具有适当信息的上下文手写Alt文本:新鲜采摘的红苹果

示例用法 - 上下文至关重要

接下来这张图片的Alt文本描述将因上下文而大不相同。

图片来源:Nico van Leeuwen

AI生成的Alt文本:一个男人站在讲台上向观众做关于无障碍的演讲。

关于Brian Teeman的页面上的手写Alt文本:Brian Teeman在一个Joomla会议上讨论无障碍。

关于无障碍的页面上的手写Alt文本:会议参与者坐在那里聆听关于无障碍的演讲。

关于JoomlaDagen 2023的页面上的手写Alt文本:荷兰Joomla用户网站无障碍的要点演讲。

这不会伤害任何人吗?

即使你忽略了你仍然会使用AI Alt文本图片描述工具时有一个无法访问的网站的事实,你可能会说“最糟糕的情况是什么,我知道它并不完美,但总比什么都没有好。”

现实是,糟糕的Alt文本可能产生许多负面影响:人们可能会因为LLM固有的偏见而受到冒犯,从而对品牌产生负面看法;盲人和视障人士可能会在购买产品时得到误导;搜索查询会产生不准确的结果;等等。

我希望我已向您展示了足够多的例子,说明为什么在图像Alt文本描述方面,目前的AI实现尚未准备好。理论上,在非常严格的参数内,应该可以生成与图像具有“等效目的”的文本替代品。但我们还没有达到那个水平。

所以不要追逐潮流或被巧妙的营销所欺骗——创建可访问文本替代品的唯一方法是自己编写它们。

在Joomla社区杂志上发表的一些文章代表了作者对特定主题的个人观点或经验,可能不代表Joomla项目的官方立场。

1
我有一个秘密要分享,但不要告诉任何人
他们不可能在谈论我,对吧?学习...
 

评论

已经注册? 在此登录
尚无评论。成为第一个提交评论的人

通过接受,您将访问https://magazine.joomla.net.cn/之外的第三方外部服务