作者:赵路 来源:中国科学报https://www.php.cn/link/b305a9a1f5bb7d20480d2d586e4ee65d
一项最新研究指出,大语言模型(llm)在识别用户错误信念方面可能存在局限性。该研究结果提示,在医学、法律和科学等高风险决策场景中,应谨慎对待llm输出的内容,尤其是在面对与事实相冲突的个人信念时。相关成果于11月4日发表在《自然-机器智能》上。
随着人工智能技术的发展,尤其是大语言模型的应用日益广泛,让这些系统具备分辨个体信念与客...
东海之滨,黄浦江畔,象征开放与机遇的“四叶草”再次迎风绽放。第八届中国国际进口博览会(以下简称“进博会”)盛大启幕,全球共享合作新机遇、共赢发展新未来。“进博老友”松下如约而至,围绕“美好生活从家延伸到城市”的参展主题,集中展出了一系列面向生活空间、公共空间及ai领域的“黑科技”解决方案,以前瞻视野与创新实力深度诠释对未来美好生活的构想与实践。
图:2025年进博会松下展台
在AI技术的深度赋能下,居家场景的交互逻辑与体验边界正被重新定义。松下依托百年家电研发的深...
科大讯飞正式推出基于全国产化算力平台的讯飞星火x1.5深度推理大模型。
该模型采用先进的MoE架构,总参数规模达293B,激活参数为30B,仅需单台昇腾标配服务器即可完成部署,推理效率较前代X1提升高达100%,端到端性能表现已达到国际同类产品水平的93%以上。
在语言理解、文本生成、知识问答、逻辑推理、数学能力及代码生成六大核心维度上,星火X1.5全面对标国际主流大模型,其中数学能力持续领跑全球。在高考数学测试中,星火X1.5取得145分的优异成绩,超越GPT‑...
2025年11月5日,第八届中国国际进口博览会(以下简称进博会)在上海启幕。三星携microled、microrgb、neoqled、oled及lifestyle艺术系列全矩阵电视产品重磅参展。作为八赴进博会的“全勤生”,三星电视凭借在显示领域的深厚积淀与对用户需求的精准洞察,持续推动行业技术迭代与产品升级。此次参展不仅全面展现了三星在高端显示、智能交互、全场景应用等领域的顶尖实力,更彰显了其深耕中国市场、助力数字经济发展的坚定决心。
三星参展第八届中国国际进口博览...
2025年11月5日,第八届中国国际进口博览会(以下简称进博会)在上海启幕。三星携micro led、micro rgb、neoqled、oled及lifestyle艺术系列全矩阵电视产品重磅参展。作为八赴进博会的“全勤生”,三星电视凭借在显示领域的深厚积淀与对用户需求的精准洞察,持续推动行业技术迭代与产品升级。此次参展不仅全面展现了三星在高端显示、智能交互、全场景应用等领域的顶尖实力,更彰显了其深耕中国市场、助力数字经济发展的坚定决心。
三星参展第八届中国国际进口...
2025年世界互联网大会领先科技奖近日揭晓,AMD人工智能开源软件平台ROCm荣获该奖项。
对于此次获奖,AMD高级副总裁、大中华区总裁潘晓明表示“人工智能是50年来最具变革性的技术,代表着计算的未来。除了提供广泛多样的计算产品组合,AMD坚信开放协作是创新的基石,重点关注生态系统的建设。今年7月,中国首家ROCm实验室在南京软件谷揭牌。未来,AMD将继续秉持‘同超越,共成就’理念,携手客户与伙伴,践行人工智能+行动计划,赋能千行百业。”
此次获奖不仅体现了业界对...
近日,美国斯坦福大学的一项研究在《自然·机器智能》期刊上发表,指出当前大语言模型(LLM)在识别用户错误信念方面存在显著短板,难以稳定区分主观信念与客观事实。研究发现,当个人信念与真实情况相悖时,这些模型常常无法准确判断何为事实、何为误信。
该成果对LLM在医学、法律及科学决策等高风险领域的应用提出了警示。研究人员强调,在涉及主观认知与事实偏差的复杂情境中,必须谨慎对待模型输出,否则可能助长错误信息扩散,甚至支持基于误解的决策。
研究团队评估了包括DeepSeek...
日常办公久坐、频繁低头使用手机,导致肩颈僵硬、腰酸背痛的问题几乎成了现代人难以避免的困扰。智能按摩椅作为缓解肌肉疲劳、促进血液循环的有效工具,正逐渐走进千家万户,成为居家健康生活的必备单品。然而面对购物平台上琳琅满目的品牌与型号,价格从几千元到数万元不等,功能宣传从“2d”到“8d”层出不穷,究竟该如何选择?
其实,无论预算高低,选对品牌是关键的第一步。建议优先考虑iRest艾力斯特、荣泰、奥佳华这类一线大牌。这些品牌具备更强的研发实力和更严苛的品控体系,产品质量更有保...
月之暗面于11月8日震撼发布其最强开源思考模型——kimi k2 thinking。该模型在人类终极考试(hle)基准中取得卓越成绩,其性能表现与开源策略引发了业界的广泛关注。
性能颠覆:Kimi K2 如何一鸣惊人?
1、Kimi K2 Thinking在极具挑战性的人类终极考试(HLE)中,取得了44.9% 的优异成绩,刷新了行业纪录。
2、这一表现使其成功超越了包括 GPT-5、Grok-4、Claude 4.5在内的多个全球顶尖的先进模型。
3、Kimi...
国产大模型再放“王炸”。月之暗面(moonshot ai)于本周四正式开源其迄今最强的思考型大模型——kimi k2thinking,不仅在权威基准“人类终极考试”(hle)中以44.9%的得分力压gpt-5、grok-4、claude4.5等国际闭源巨头,更以仅460万美元(约合3277万元人民 币)的训练成本,掀起一场高性价比ai革命。
这一成绩尤为震撼之处在于其极致的成本控制。据CNBC援引知情人士透露,Kimi K2Thinking的训练投入远低于DeepSee...