
Meta的基础AI研究(FAIR)团队于6月29日发布了Brain2Qwerty系统第二版,展示了非侵入性脑到文本解码器有史以来最高的准确率。该系统将脑磁图(MEG)记录翻译成完整句子,无需手术,无需植入物。
工作原理
志愿者佩戴装有磁传感器的头盔,这些传感器测量神经元电活动产生的微弱磁场。当他们打字时,系统通过将分布的神经活动模式映射到文本来重建预期单词。从解码单个字符的v1版本升级体现了雄心的飞跃:v2处理连续的MEG记录并重建整个句子。
该系统使用从9名志愿者收集的约22,000个打字句子进行训练,每人花费约10小时在MEG扫描仪内。
准确率数据
Brain2Qwerty v2在所有参与者中达到61%的平均单词准确率,最佳表现者达到78%。在字符层面上,单词错误率平均为39%,最佳表现者降至22%。
这些数字与近乎完美的语音转文本系统或侵入性脑机接口相比并不突出,Neuralink的N1植入物的字符错误率低于5%,但对于完全非侵入性方法来说,它们代表着重大突破,只需要头戴式传感器阵列。
开放科学,非专有
Meta正在GitHub(facebookresearch/brain2qwerty)上公开发布系统代码和训练数据集,同时设立500万美元(约400万英镑)的开放神经科学研究基金。该研究成果同时发表在《自然·神经科学》杂志上。
这种开源方法与Meta向专有AI产品的广泛转型形成鲜明对比,后者以Muse Spark产品线为代表。FAIR对开放神经科学研究的持续投入表明,该公司看到了维持独立研究身份的战略价值。
非侵入性的优势
Brain2Qwerty的目标人群是因ALS、中风或闭锁综合征等神经系统疾病而失去说话能力的人。对于这些人来说,即使61%的单词准确率也代表着此前不存在的沟通渠道。
MEG技术仍然存在重大实际限制:扫描仪是房间大小的设备,耗资数百万美元,需要磁屏蔽环境。便携式部署仍需数年时间。
尽管如此,v2的结果正在改变关于脑机接口的讨论。该领域长期以来一直认为高保真神经解码需要打开颅骨。Brain2Qwerty v2表明,算法改进可以在不跨越手术门槛的情况下缩小差距,从而使这项技术有可能惠及数百万人,而不仅仅是少数愿意接受侵入性手术的人。
婷 翻译

