身为世界顶级的数据库专家,新加坡国立大学杰出教授黄铭钧最为人津津乐道的,是他与工业界的紧密结合,总能第一时间将科研成果转化为生产力。以当下火热的区快链为例,他与研究团队先后贡献了首个区快链测评套件 BLOCKBENCH、高性能的区快链数据存储系统 FORKbase 以及医疗区快链系统 MediLot,完美实现了产学研相结合。在 10 月 25 日—27 日杭州国际博览中心(G20 会场)举行的 2018 中国计算机大会(CNCC 2018)上,黄铭钧将与大家分享他对企业级区快链系统的思考。
2018 ABC SUMMIT百度云智峰会百度云重磅宣布推出云农、云制、云服三大产业平台
2018 ABC SUMMIT百度云智峰会百度云重磅宣布推出云农、云制、云服三大产业平台日前,2018 ABC SUMMIT百度云智峰会召开。本次大会邀请农企龙头中化农业,国内最大钢铁企业宝武集团,骨干金融险企中国人寿等各行业顶级企业出席,携手百度云共同讲述ABC时代下,全产业智能化变革的具体业务实践。大会现场,百度云宣布推出云...黄铭钧(Ooi Beng Chin),新加坡国立大学杰出教授、浙江大学长江学者讲座教授、新加坡科学院院士、ACM Fellow、IEEE Fellow。主要研究方向包括数据库性能问题、索引技术、内存数据管理、云计算和并行系统的研究与高级应用等,并致力于"ABCD"(AI,Blockchain,Cloud Computing,Data Driven Technology)领域的创新与产业化。1985 年毕业于澳洲莫纳什大学,获一等荣誉学士学位,1989 年获得博士学位,之后加入新加坡国立大学并于 2000 年晋升正教授。2007 至 2013 年,担任计算机学院院长,期间将新国大在 QS 计算机学科的排名提升到世界第 8 名。目前担任新加坡国立大学人工智慧系统研究院院长、新加坡最大出租车公司康福德高(ComfortDelGro)的独立董事,并领衔新国大苏州人工智能创新及产业化中心研发人工智能,推进人工智能在医疗保健、金融科技等领域的科技创新。
今年十月黄铭钧将前往美国西雅图参加国际数据库前沿展望会议(The Database Research Self-Assessment Meeting),这个闭门会议每届只邀请二十几位世界顶尖的数据库专家出席,身为唯一华人代表的黄铭钧已经连续受邀出席三届会议,「数据库界泰斗」的身份不言而喻。
此外,他还是 CCF 海外杰出贡献获得者,身兼新加坡科学院院士、ACM Fellow、IEEE Fellow、浙江省人工智能发展专家委员会委员等职位,由他领导的新国大人工智慧系统研究院设计的 SINGA 深度学习系统,是第一个进入国际顶级开源社区 Apache 孵化器的深度学习系统项目——一个可以让用户制定运营战略和开发新产品的分布式深度学习平台。
黄铭钧的研究兴趣包括数据库性能、索引技术、大数据、多媒体及空间数据库处理、内存数据管理、云计算和并行系统的研究与应用等,这些年来陆续在 ACM SIGMOD、VLDB、IEEE ICDE 等国际会议和 ACM TODS, IEEE TKDE, VLDB 等期刊发表 200 多篇论文,被引用 19134 余次,H-Index 为 74(2018 年 9 月的 Google Scholar 数据),并且多次受邀担任 SIGMOD、VLDB 和 IEEE ICDE 等多个数据库业内顶尖会议的委员会主席。
据《火星财经》报道,在担任新加坡国立大学计算机学院院长期间(2007 年—2013 年),黄铭钧甚至成功将新国大在 QS 计算机学科的排名提升到世界第 8。这些引人瞩目的成就,并未将黄铭钧「困」在象牙塔里,反而成为他向工业界进击的「燃料」。
区快链+医疗=MediLOT
近年来,随着硬件和数据的日渐完善,机器学习与深度学习在业界得到了广泛的应用,然而在具体落地的过程中依然存在数据提取耗、存储格式不统一、非结构化数据、数据清洗、数据缺失、数据重复等问题,尤其在 AI 医疗诊断领域,医疗编码规范的不统一和医疗信息的复杂性更是制衡着该领域的发展。
针对以上问题,黄铭钧带领团队打造出了 MediLot——一个基于区快链的医疗保健数据管理和分析平台,借助区快链的防篡改特点,保障不同医疗保健机构之间的医疗记录的归档,使得数据来源追踪、数据分析以及根据病人喜好量身订造的医疗变得可能,将医疗管理和研究推向更好的未来。
在黄铭钧看来,理想的医疗数据共享体系应以患者为中心,患者拥有最高权限管理自己的病史记录。简而言之,患者可以授权 MediLot 将自身病史数据的访问权限记录在区快链上,在有需要时通过链下点对点网络将数据发给第三方机构使用,医生也可以通过平台上的算法和分析模型预测病人病情的发展,从而做出最精准的医疗诊断。
MediLot 并非停留在概念上的「意淫」系统,而是已经在新加坡国立大学医院(NUH)中落地使用。今年年初,启动 ico 的 MediLOT 很快就拿到了两笔大额投资,新加坡政府部门也表达了参与意愿。从长期来看,MediLOT 上的完整临床诊断数据,对于年轻医生的经验成长和提振中小规模医院的医疗水准,不可不说是个宝藏。
区快链的底层优化
黄铭钧的研究向来走在社会的前沿。面对热火朝天的区快链市场,黄铭钧冷静地指出目前区快链领域尚存在的一些问题:区快链系统的性能有限,远远低于最先进的数据库系统的预期。这项结果在他与团队共同研究设计的区快链测评套件 BLOCKBENCH 中得到证实——BLOCKBENCH 是首个研究和比较许可型区快链的性能的 benchmark。在论文中,黄铭钧与团队提出了 4 种改进区快链的方法:
1、将存储、执行引擎和共识层彼此解耦,然后独立优化和扩展;
2、接纳新的硬件:多核 CPUs 和大内存、可信硬件;
3、分片分区:区快链本质上是一种复制状态机系统,系统内每一个节点维护了相同的数据;
4、支持声明性语言。
而黄铭钧并未让优化工作停留在「纸上谈兵」,随后与团队共同发布了高性能的区快链数据存储系统 Forkbase,旨在支持需要数据版本控制、分叉和防篡改等功能的区快链系统。
「创业从很大程度上来说,是系统研究员生活中不可或缺的一部分。一创业,就必须关注整个系统的研发,而不仅仅是做局部的设计,来支撑自己提出的理论。」这是黄铭钧一直以来坚守的治学理念,他也用身体力行的成果向我们展示了这份坚守。