【SUPD-060】DIGITAL CHANNEL AYA 通义千问赓续开源! 阿里云38篇论文被顶会ACL 2024托付

发布日期：2024-08-15 07:20 点击次数：143

【SUPD-060】DIGITAL CHANNEL AYA

近日，阿里通义大模子赓续开源，Qwen2系列开源家眷新增音频言语模子Qwen2-Audio、新一代数学模子Qwen2-Math。同期，通义团队同步推出了一套全新的音频采集模子测评基准，相关论文已被计算言语学和当然言语搞定限度的顶级学术会议国际顶会ACL 2024托付。

值得道喜的是，在ACL 2024中阿里云本年共有38篇高水平论文被托付。其中包括通义千问团队多篇大模子相关论文，主题波及大模子SFT工夫、LLM变装演出智商、多模态模子测评基准等。

韩国伦理电影

通义展台被宇宙各地的NLP 询查东说念主员和配置者围不雅

通义千问赓续开源多模态模子：

Qwen2-Audio音频言语模子

Qwen2-Audio是一款大型音频言语模子（Large Audio-Language Model ，LALM)，具备语音聊天和音频分析两种使用阵势，较之前一代模子Qwen-Audio，新版模子有了更强的声息采集智商和更好的教导作陪智商。现在该模子在多个泰斗测评中都显赫杰出先前的最好模子。

Qwen2-Audio 在多个测评中都显赫杰出了先前的最好模子

Qwen2-Audio在使用时无需文本输入，不错径直进行语音书答，采集并分析用户输入的音频信号，包括东说念主声、当然音、音乐等。同期还梗概自动已毕两种阵势的切换。现在，Qwen2-Audio已支柱逾越8种言语和方言，如汉文、英语、法语、意大利语、西班牙语、德语、日语，粤语。

让Qwen2-Audio听了一段潘展乐赛后采访【SUPD-060】DIGITAL CHANNEL AYA

同期，通义团队同步开源了基础模子 Qwen2-Audio-7B 偏激教导作陪版块Qwen2-Audio-7B-Instruct，用户不错通过Hugging Face、魔搭社区ModelScope等下载模子，也不错在魔搭社区“创空间”径直体验模子智商。

通义千问开源数学模子：

Qwen2-Math数学专项模子

Qwen2-Math新一代数学模子，包含1.5B、7B、72B三个参数的基础模子和教导微调模子，也已于不久前认真开源。

Qwen2-Math基于通义千问开源大言语模子Qwen2研发，旗舰模子 Qwen2-Math-72B-Instruct在泰斗测评集MATH上的得分杰出GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等，以84%的准确率搞定了代数、几何、计数与概率、数论等多种数知识题，成为起始进的数学专项模子。

MATH基准测评中，亚洲欧美另类通义千问数学模子的旗舰款

Qwen2-Math-72B-Instruct取得了84%的准确率，

通义团队在多个中英文数学基准测评集对教导微调模子作了性能评估，除了 GSM8K 和 MATH等常见的测评基准，还引入了更具挑战性的查考竞赛类测试，如奥林匹克级别的基准测评OlympiadBench、大学数学级别的基准测评CollegeMath、高考（GaoKao）、好意思国数学邀请赛（AIME）2024 赛题、好意思国数学竞赛（ AMC）2023赛题，汉文测评则有CMATH测评集、2024年中国高考和中考数学题。最终，Qwen2-Math-72B-Instruct发达优异，在十大测评中都得到了远超其他开源数学模子的收获。

38篇论文被ACL2024收录：

通义成为ACL现场最受关爱的中国大模子

阿里云一直以来都是ACL论文入选数目最高的科技公司之一，本年累计有38篇著述被大会收录，包括16篇主会论文。手脚中国大模子“开源灵通”力量的代表，通义大模子团队在本次大会清晰了多项大模子前沿工夫，并在现场与宇宙各地的NLP研发东说念主员和配置者靠近面疏通。

部分收录论文

《Large Language Models are Superpositions of All Characters: Attaining Arbitrary Role-play via Self-Alignment》初度提议用于大模子变装演出的自我对都战略DITTO，显赫进步了LLM的变装演出智商，通义团队已将DITTO开源；

《AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension》先容了通义团队推出的音频言语采集模子测评基准AIR-Bench，用于评估模子的生成式教导作陪智商，填补了业界空缺；

《How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition》通过一系列施行展示了SFT数据若何影响LLM的数学、代码、东说念主类对都智商，可为询查者和配置者的SFT责任提供模仿。

外洋配置者基于Qwen西席了泰语大模子和东南亚语大模子

自2023年8月以来，通义千问仍是开源数十款LLM、多模态和专项智商模子，Qwen系列开源模子下载量逾越了2000万。

在东南亚地区，通义千问开源模子也有许多诚实用户，开源社区络续可见基于Qwen西席的泰语、越南语、东南亚语等大模子。比如，新加坡工程师刘乾基于Qwen1.5西席了广受接待的东南亚语大模子Sailor，袒护0.5B、1.8B、4B、7B、14B等全套尺寸；越南语工程师Nguyen Quan配置了越南语大模子，他说：“阐述咱们里面的基准测评，Qwen2基础模子杰出了现在市集上通盘的闭源大言语模子”。

ACL 2024现场参会者给通义的传话【SUPD-060】DIGITAL CHANNEL AYA

【SUPD-060】DIGITAL CHANNEL AYA 通义千问赓续开源! 阿里云38篇论文被顶会ACL 2024托付

热点资讯

相关资讯