大型多模态模型(LMMs)将不断涌现,并在争论中取代LLMs。
类似GPT-4的全部功能将开源,而且速度更快、成本更低。这和GPT-5一样让我兴奋。
2023年9月,79元眉笔事件爆发,但如果不是那封公开信,保持沉默的花西子未必会有后来更大范围的公关危机。
用户只需在通义千问APP内输入“通义舞王”或“全民舞王”等口令,然后按照提示要求上传自己的照片。系统会在十几分钟内生成一个神形兼备的舞蹈视频,保留原形象的面部表情、身材比例、服装以及背景等特征。
这个项目的开源意味着更多的开发者和研究人员可以使用这项技术,为其添加新的功能或者进行改进。DreamTalk的开源将为语音合成技术的发展带来新的动力。