生成式ai 技术越来越接地气,直接塞进手机里做生活帮手,成了各大公司的主攻方向

虽然国内互联网科技企业都在争相布局AI生活助手这块新赛道,但是谁能胜出还得看技术路径和合规问题怎么解决。现在生成式AI技术越来越接地气,直接塞进手机里做生活帮手,成了各大公司的主攻方向。阿里巴巴集团最近给自家的“千问”加了很多料,把外卖、酒店机票预订、餐饮推荐还有网购这些常用服务都接进来了,这说明AI不光能说话聊天,还能帮人实实在在地花钱消费。这个功能主要是靠阿里巴巴自己的生态系统来撑腰。比如你问它买杯咖啡,它就能调用“淘宝闪购”,根据你的位置给你推送附近的店和商品,选好后还能直接用支付宝付钱,全程都在软件里搞定。要是出门旅行,“千问”会用飞猪平台来查航班和酒店。还有电商推荐这块,“千问”说它能把淘宝上的海量评价数据综合起来,给你挑出合适的东西,好让你少花时间选东西。技术上,“千问”走的是API对接的路子。它先听明白你要啥,然后给对接好的合作平台发请求拿数据,最后把符合条件的商品或者服务显示出来,帮你生成个待付款订单。不过在真正付账的时候,“千问”会把决定权留给你,必须你亲自审核才行。 自从“千问”上线后,用户主动问商品问题的人明显变多了,说明大家还是挺想让AI帮着做决定的。不过现在手机上的AI助手竞争特别激烈,各家选的路数不一样,面临的挑战也不一样。跟“千问”不同,字节跳动的“豆包手机助手”是靠读屏幕内容和模拟手指点击来跟别的软件打交道。这种方法好处是不用一个一个去跟软件商量接口,但坏处是速度可能慢、稳定性差;更关键的是它得用设备底层权限去看屏幕内容和操作手机,这就让很多人担心数据会不会被偷看、权限会不会被滥用、有没有合规风险。听说因为合规问题,“豆包手机助手”已经暂停了一些调用第三方应用的功能。 就算API模式在流畅度和可控性上有优势,要想大规模推广也不容易。业内专家说,国内互联网的环境比较封闭,愿意把API接口对外开放的软件不多,就算开了口子功能也比较有限。这就导致靠API做助手的服务范围受限、应对不了个性化和冷门需求。“怎么让机器像真人一样灵活地玩手机满足各种复杂需求?”还是现在的技术难题。 不管是API深度集成还是读屏模拟那种通用方法,大家都得在技术好不好用、生态合不合得来、能不能赚钱和是不是合法这几个方面找个平衡点。从单纯聊天变成深度连接服务,AI正快速改变我们玩手机和买东西的方式。“千问”和“豆包助手”代表了两种不同的思考方向。这场竞赛不光是比谁技术强,更是对数据安全、用户权益、平台生态开不开放还有行业规不规范的全面考验。 未来谁能又稳当又顺利地打通技术、体验和合规的圈子,赢得用户信任还能赚到钱,就能决定下一代手机界面的样子。中国的人工智能应用产业也会在这样的摸索和竞争中越来越成熟。