李开复新作《人工智能》（连载之十）

（连载之十）

智慧生活
从机器翻译到智能超市

　　在本书的开头，我们已经提到过，人类生活中已处处是人工智能的身影。我们日常使用的手机上，几乎每个流行的应用程序里面都有人工智能大显神通的地方。那么，放眼5到10年后的未来，我们每个人的生活中，到底还会有哪些人工智能元素熠熠生辉呢？
　　与机器视觉、语音识别取得的突破相比，人工智能对人类语言的理解目前还处在相对滞后的阶段。基于深度学习的人工智能算法已经可以十分准确地完成“听写”或“看图识字”的操作，但对听到的、看到的文字的意思，机器还是比较难以准确掌握。
　　未来5到10年里，在自然语言理解方面，也许最可能取得重大突破的就是机器翻译。在本书开头，我们已经谈到过谷歌公司的机器翻译系统在2016年取得的重大突破。目前的机器翻译水平，大概相当于一个刚学某种外语两三年的中学生做出的翻译作业。对于多数非专业类的普通文本内容，机器翻译的结果已经可以做到基本表达原文语意，不影响理解与沟通。
　　那么，假以时日，不断提高翻译准确度的人工智能系统，会不会在某个普通的日子里，像下围棋的AlphaGo那样悄然越过了业余译员和职业译员之间的技术鸿沟，一跃而成为翻译大师了呢？
　　还记得《星球大战》电影中的C-3PO机器人吗？据说C-3PO可以流利地完成银河帝国里超过六百万种语言的对话交流，这是一个不折不扣的来自未来的翻译大师。在《星球大战》的世界里，人类是不需要学习星际语言的，人类口译员、书面翻译、同声传译员等工作也没有必要存在，一切都可以交给这个机器人来解决。
　　C-3PO机器人预示的未来，真的离我们很远吗？一旦机器翻译技术在不断积累的基础上突破了人类可接受的心理阈值，达到了人类翻译的水准，那时，我们有何必要花费生命中大约五分之一的时间去学习和精通一两门甚至更多门的外语？我们有何必要雇用如此多的翻译职员？出门旅行，出国参与商务或学术活动的时候，带上一部安装了机器翻译程序的手机，不就可以与外国人顺利沟通了吗？
　　顺着自然语言理解的方向，我们还可以发挥想象。今天的微软小冰、苹果Siri等对话机器人，还远远不能达到“聪明”的程度，因为它们无法深入理解人类语言的含义。一旦自然语言理解的方向上有了突破，这些对话程序将一跃成为每个人每天都想聊上几句的好伙伴、好帮手，那时，是否突破图灵测试已经不再重要，重要的是真正“聪明”的聊天程序到底能为我们的生活带来什么改变。
　　那时候，不只是手机会和人智能对话，我们每个家庭里的每一件家用电器，都会拥有足够强大的对话功能。亚马逊公司于2015年开始销售的Echo智能音箱，就是这个应用方向的一次成功尝试。
　　亚马逊Echo是一个能听懂人说话的智能小音箱。它的听音模块做了特殊的技术处理，可以在绝大多数室内家居环境下，清楚地分辨出用户发出的语音指令，甚至当用户距离音箱有一定距离的时候也是如此。在自然语言理解技术还没有达到人类心理预期的时候，亚马逊Echo做了一个十分明智的设定：它只擅长和用户聊某几类很具体的话题，比如，音乐播放相关的话题，天气相关的话题，设置时钟或提醒，等等。这样一来，因为限定了对话场景，亚马逊Echo对人的语音指令的识别准确率就可以大幅度提升。而且，在只谈音乐的情况下，很多用户都认为，亚马逊Echo表现得足够“聪明”。
　　更为重要的是，亚马逊Echo音箱只是亚马逊的智能会话系统与用户交流的一个终端。实际上，用户对Echo说的话，都会被上传到亚马逊的Alexa服务进行解析。这样一来，亚马逊的Alexa服务就有能力收集到越来越多的真实用户交互样本。基于这种方式，亚马逊很快就可以建立起非常庞大的用户交互行为数据集，在这个数据集的基础上，用机器学习算法不断迭代，取得重大的技术突破只是时间问题。
　　和亚马逊类似，中国的家用电器厂商也在积极为各自的电器引入智能功能。例如，小米公司旗下的一系列智能家电，都在智能功能上做了不同程度的探索和尝试。大疆无人机的团队也在积极储备人工智能人才，为无人机配上智能避障、智能拍照等功能。创新工场投资的小鱼在家智能家庭助手，就拥有通过人脸、动作和声音识别，自动捕捉并录制孩子在家活动画面的有趣功能。2017年1月，小鱼在家还和百度一起发布了基于百度自然语言对话式人工智能操作系统DuerOS的新产品。
　　亚马逊在人工智能方面的许多尝试都让人眼前一亮。2016年年底，亚马逊宣布了一个几乎震惊整个科技界的大新闻：亚马逊开办了一家不用排队、不用结账、拿了东西就可以走人的小超市，名字叫亚马逊Go！

亚马逊不用排队、不用结账、拿了东西就走人的Go商店

　　没错，这是一家利用人工智能技术管理的小超市。你只要走进去，拿你想拿的东西，然后大摇大摆地走出去就好了。超市的每个货架都布满摄像头等传感器，利用机器视觉技术记住每个顾客到底都拿了哪些商品，顾客出门时，再根据人脸识别辨认出来顾客的身份，自动到顾客预先关联的结算方式（如银行卡）上结账。顾客的整个购物体验，完全可以不用排队，不用亲自结账。
　　从机器翻译到智能家电，再到智能超市，人工智能技术给我们生活带来的巨大变化才刚刚开始。其实，如果回到10年以前，2007年苹果才刚刚发布第一代iPhone手机，那时谁会想到只用了10年的时间，智能手机就无处不在了呢？类似地，从现在算起，再过10年，大家可以看看我们的生活细节发生了哪些变化。今天的我们绝对没法准确预测，未来10年中人工智能可以给我们的生活带来多么巨大的改变。

智慧医疗
AI将成为医生的好帮手

　　人工智能对人类最有意义的帮助之一就是促进医疗科技的发展，让机器、算法和大数据为人类自身的健康服务，让智慧医疗成为未来地球人抵御疾病、延长寿命的核心科技。
　　很多年前，还处于萌芽期的人工智能技术就对药物的研发起过积极作用。世界上第一个专家系统程序Dendral是一个由斯坦福大学的研究者用Lisp语言写成的，帮助有机化学家根据物质光谱推断未知有机分子结构的程序。这个程序衍生出了许多判断有机物分子结构的变种。相关算法在20世纪60年代到70年代就开始被用于药物的化学成分分析和新药研制。
　　今天，在制药领域，以深度学习为代表的人工智能技术可以发挥比六七十年代时大得多的作用。一家总部位于伦敦的名叫BenevolentAI的创业公司，就在做一个有趣的尝试：他们让人工智能系统阅读存储在专利数据库、医疗数据库、化学数据库中的专利、数据、技术资料，以及发表在医药学期刊上的论文，通过机器学习来寻找潜在的可用于制造新药的分子式或配方。为了更好地将人工智能与医药相结合，这家初创公司甚至还设置了一个“首席医药官”（CMO，Chief Medical Officer）的职位。
　　对于人工智能为制药业提供的帮助，《经济学人》撰文评论道：“制药公司越来越难在寻找新产品方面取得突破，原因之一是大多数明显有用的分子已被发现，这导致开发周期长，失败率高。同时，科学成果的数量每九年翻一番，要理解所有不同类型的数据已非人力所及。这正是AI可以发挥作用的地方——它不仅可以‘摄取’从论文到分子结构、基因组序列和图像的一切信息，还能自主学习，建立关联，形成假设。AI可以在几周内阐明突出的关联，提供新的想法，而人类要想取得同样的成果，可能会穷尽毕生之力。”
　　大数据和基于大数据的人工智能，为医生辅助诊断疾病提供了最好的支持。例如，Celmatix公司是一家为妇女健康提供医疗解决方案的初创公司。Celmatix公司首席执行官派瑞·Y. 贝姆（Piraye Yurttas Beim）博士说：“大数据在Celmatix中引领我们的工作。它让内科医生可以根据每个人的多项数据，而不止于年龄，对女性怀孕的概率提供诊断。”
　　根据硅谷银行2016年9月举办的HealthTech活动对超过200名医疗或相关行业创业公司高管的调查，有46%的被调查者认为大数据是未来医疗行业里最有前景的技术，而35%的被调查者则认为人工智能是最有前景的技术。
　　IBM则将其著名的人工智能系统Watson用于辅助癌症研究。IBM公司联合了20多个顶尖的癌症研究机构，用这些机构提供的大数据，来教会Watson理解基因学和肿瘤学。研究小组只花了一个星期，就教会Watson读完了2500篇医学论文。参与此项研究的北卡罗来纳州立大学教堂山分校的诺尔曼·沙普利斯（Norman Sharpless）评论道：“要知道我们每天发表的研究论文有8000多篇，你知道，没有人能够每天阅读8000篇论文。所以我们发现我们提出的最新治疗方案往往是基于过去的信息，落后了一两年的信息。然而，这正是适合Watson的任务。”基于Watson系统的实验颇有成效，诺尔曼·沙普利斯说：“在30%的病人中，Watson发现了新的东西。也就是说，有大约300多人，Watson找到了治疗方法，但是一群认真工作的医生却没有找到。”
　　2017年2月，发表在《自然》杂志上的一篇论文介绍了一次有关皮肤癌诊断的人与机器的“较量”。在该论文所揭示的研究中，科学家们让一个卷积神经网络分析了将近13万张临床上的皮肤癌图片，这个数字比现在最大的研究用图片集高出了两个数量级。在大量学习资料的支持下，这个神经网络迅速成为一名皮肤癌方面的专家。
　　研究者让这个计算机皮肤癌专家与21名资深的皮肤科医生“同场竞技”。在第一场挑战中，这个神经网络与医生们一同区分两种不同的皮肤疾病——角质细胞癌与良性脂溢性角化病。前者是最为常见的皮肤癌。综合灵敏性和特异性来看，这个神经网络的表现比大部分参与研究的皮肤科医生都要好。不服气的人类做了第二项测试，这次他们比较的是恶性黑色素瘤与良性的痣。前者是最具杀伤力的皮肤癌。但在这场比试中，人类同样败下阵来。
　　用AI来辅助疾病诊断，并不是要在所有领域都超越顶尖医生。其实，AI可以给经验不足的医生提供帮助，减少因为经验欠缺而造成的误诊。或者，AI可以帮助医生提高判读医疗影像、病理化验结果的效率，让高明的医生可以在相同时间内给更多的病人提供服务。随着基因测序和基因诊疗技术的完善，AI技术还可以帮助医生针对每个人的基因序列，制订个性化的医疗方案。
　　今天，世界医疗资源分布严重不均衡，很多国家医生数量不足，发展中国家社区医生的水平与顶尖医生相差甚远。在AI的帮助下，我们看到的不会是医生失业，而是同样数量的医生可以服务几倍、数十倍甚至更多的人群。医疗资源分布不均衡的地区，会因为AI的引入，让绝大多数病人享受到一流的医疗服务。
　　更重要的是，在AI的帮助下，顶尖的医生和科学家可以腾出时间来，从事那些真正有挑战性的科学研究。比如说，AI可以大大地节省医生们诊断癌症所花费的时间，提高癌症的早期诊断效果，大大降低癌症死亡率。这时，基础研究就可以向其他威胁人类生存的疾病倾斜，也可以有更多资源来研究如何延长人类寿命。例如，今天的科学界大致认为人类的自然寿命可以延长到120岁左右，那么，未来如果有更多80岁、90岁以上的老人，就会有更多的人面对阿尔茨海默病等老年疾病的威胁。在AI的帮助下，我们可以更有效地分配医疗资源，帮助人类既延长寿命，又拥有健康的生活品质。
　　与其他行业的大数据相比，获取高质量的医疗影像数据相对比较困难。不同医疗机构的数据，目前还很少互通、共享。而单个医疗机构积累的数据往往不足以训练出有效的深度学习模型。此外，使用医疗影像数据进行人工智能算法的训练还涉及保护病人隐私等非技术问题。因此，在基于医疗影像的智能诊断方面，无论是数据还是算法，都有相当大的提高空间。
2017年1月，著名的机器学习算法竞赛平台Kaggle宣布，作为2017年度的数据科学大赛的首要目标，设立100万美元的奖金，奖励能够在肺癌检测中大幅提高自动检测准确率的团队。这是工业界对人工智能辅助医疗科研提供大力支持的有效方法之一。
　　围绕Kaggle这一竞赛，学术界和工业界预计将有数千支团队投入到肺癌影像的智能识别研究上。这将极大地促进肺癌智能诊断技术的发展。据统计，美国每年新增的肺癌患者就有22.5万人，每年消耗在肺癌诊疗上的经费大约为120亿美元。如果相关的人工智能算法能大幅提高肺癌早期诊断的准确率，这对人类整体健康而言，的确具有难以估量的现实意义。
　　顺便提一句，机器学习算法竞赛平台Kaggle于2017年3月被谷歌收购，成为谷歌云服务平台的一部分，这从另一方面展示了数据与算法竞赛对于人工智能科研的重要性。　　　　　　　　　　（待续）