印度首家IT公司推出“印度版ChatGPT”，支持英语和40种印度方言，助力印度语言计算发展

AI头条· 2023-09-05 14:49:13

最近，印度IT公司Tech Mahindra宣布推出了一个面向印度语言的开源基础语言模型“Project Indus”。该项目可能会成为该公司迄今为止最重要的项目。目前，像OpenAI的GPT模型这样的大型语言模型，尽管具有多语言能力，但在理解和生成印度语言内容方面受到英语数据集的限制。

3_1693893980265_ai2023_Startups_in_India_2832180c-e96d-4f95-81fc-13bb14c3229f.png

图源备注：图片由AI生成，图片授权服务商Midjourney

Tech Mahindra首席执行官古尔纳尼表示，该模型将是最大的印度语言模型，可能为全球25%的人口提供服务。 Tech Mahindra尚未透露项目成本或预计发布时间，但目标是首先构建一个70亿参数的语言模型。

该模型最初将支持40种不同的印地语言方言，后续将逐步添加更多语言和方言。他们表示，尽管目前一些印度语言模型Bhashini和AI4Bharat等已经存在，但仍需开发一个基础模型。他们的接口可能具有语音和文本信息，但尚未考虑加入类似ChatGPT的聊天界面。

Tech Mahindra的首要目标是首先创建一个用于文本继续的语言模型，然后提供对话功能。一旦模型的性能和方言生成效果明确，他们将在开源中发布。

印地语言模型可以优先考虑文化敏感性，确保生成内容尊重当地习俗和规范。它还可以使AI普及，为该国更广泛的非英语使用者提供服务。

然而，采集不同语言和方言的数据仍然是Tech Mahindra面临的最大挑战。为此，该公司正在寻求不同方言使用者的贡献，以帮助构建数据集。他们已开设了一个门户网站，以获取印度人的语言捐献。

您可能关注: ChatGPT AI

文章链接: http://huangxinwei.com/aizixun/494.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表炎黄立场。

下一篇李彦宏称创业者卷大模型没意义：关注应用开发的机更大

炎黄AI写作网