登录遇到问题
Q:长时间接收不到验证码怎么办?
A:您可以拨打我们的客服热线400-183-1832进行语音辅助
没找到相关问题?点此联系客服
选择国家地区
指南者留学logo
指南者留学
选校/定位/规划 必备工具
打开App
香港中文大学计算机视觉和人工智能教授分享创业经历
指南者留学 2023-04-27 17:50:49
阅读量:1604

不是每个人都勇于另辟蹊径,港中大著名计算机视觉和人工智能专家贾佳亚教授早于学生时代已一头栽进充满未知的研究范畴。他说:"20年前,人工智能(AI)声名不佳,因为它的智慧水平很低。"然而,贾教授潜心研究AI的高瞻远瞩和坚毅,为他的人生履历锦上添花,包括创立一家科技独角兽公司,以及获颁"香港创新企业家年度大奖"。

 

贾教授乘着全球工业4.0的技术浪潮,2019年创立专注于智能制造业的思谋集团有限公司(SmartMore),透过自动持续优化提高生产效率与质量。凭借20多年的研究经验,他带领团队打造了扩展快、应用层面广泛的智能平台。SmartMore体现了港中大锐意推行研究商业化,肩负发展城市创科生态系统的重任。

 

燃点智能制造业之星火

 

贾教授指出,新一代的"智能机器"开始取代德国、日本、美国和中国大陆工厂中低端的"传统机器",可以在无人工作间全天候24/7暗中运行,智能机器的传感器相当于人的眼睛、耳朵和鼻子,甚至拥有AI的"大脑"来监控生产线,发现缺陷时会实时做决策。与传统工厂相比,这是一个重大进步,因为在传统工厂中,"不懂思考"的机器只会无意识地重复机械动作。

 

SmartMore在短短18个月内,由一家初创企业变身为市值10亿美元的独角兽。公司现时在全球有过千名员工,逾七成员工拥有硕士或博士学位,研发人员及研发开支占比皆超过六成,服务逾100家行头企业,包括空中客车、卡尔蔡司和多家《财富》世界 500 强公司。

 

AI涉及高端技术,研发开支非常昂贵。现时谷歌、OpenAI和微软等科技巨头已花费数十亿美元开发"通用人工智能"(英文缩写为AGI),ChatGPT是其中一例。电话面世75 年后才达到一亿用户,WhatsApp 则用了三年半,而ChatGPT在短短两个月内已达到了这个规模。

 

贾教授解释说:"AGI必须精通不同范畴的知识,所以研发开支非常昂贵。SmartMore之所以发展迅速,在于我们针对制造业用户的痛点提供专门的人工智能解决方案。"

 

为表扬贾教授对推动智能制造和数码创新的热忱,香港工业总会(工总)于今年2月中旬向他颁授首届"香港创新企业家年度大奖"。他说:"我很荣幸获得这个奖项。SmartMore承诺推动智能制造和支持香港的再工业化计划,从而创造更多就业机会,并改善创科生态系统。"

 

一个改变生命的决定

 

贾教授坦言,他在25多年前离开家乡到复旦大学学习时,几乎不知道甚么是计算机。他说:"但我意识到我们已经进入了使用计算机的新时代,所以选择修读计算机科学。"如今,他是港中大计算机科学与工程系的终身教授。

 

他是国际电气和电子工程师学会(IEEE)的院士,论文被引用超过50,000次。他是AI研究的重点期刊《IEEE模式分析与机器智能汇刊》的副主编,曾在微软亚洲研究院、Adobe公司和腾讯担当重要的职务。

 

他本来可以选择研究网络、数据库设计和算法等范畴。他表示:"但我喜欢看漂亮的图片、照片、影像——视觉内容不仅仅是一堆数据或数值,而是我可以直接感知的东西。我对自己说,如果我想直接看到图像结果,为什么不选择图像处理或计算机视觉呢?"

 

从科幻到现实

 

计算机视觉现已在是AI模拟人类感知的一部分,举例说,计算机可以区分猫和狗的图像。但贾教授坦言,20年前的AI并不精密,甚至难以完成最简单的任务,例如识别印刷纸上的字母或字符。

 

2012年以前,连接成百上千个计算机"神经元"(就像人脑中的突触)的算法大多会产生乱码。然而,当加拿大科学家开始将算法应用于数百万个神经元时,他们开辟了AI的新天地,输出的结果变得有秩序而且有意义。计算机终于能够解读图像,可以找出猫与狗的区别。

 

他笑着说:"从那时起,我们终于被称为'AI研究人员',因为计算机视觉不再是科幻的。我们感到它会变得强大、有用,适用于许多领域。"贾教授和他的博士生自此开始了另一个十年的艰苦奋斗,其中一个重点是研究如何引入计算机"神经元",并结合包括自然语言、图像、录像和声音在内的多模态信息。他其中一位博士毕业生徐立现在担任全球其中一家最大的AI公司商汤科技的行政总裁。

 

领先群雄

 

AI研究是一场激烈的时间竞赛。贾教授观察到技术不断推陈出新,说道:"每个算法只能用半年左右。不仅仅是计算机工程正在快速演变,AI的智慧水平也越来越高,如果我们要与时并进,就必须密切关注这个研究范畴的新趋势。"

 

他联同其顶尖门生密切关注研究领域的趋势。"这些研究相当密集,意味着很多人同时研究同一个课题。一个以往需时50年的研究课题,现在可以在半年内解决——然后我的博士就要另觅一个新课题来研究。"

 

目前贾教授门下的博士生多达40人,他们从教授20多年的研究资历中获益甚丰,有助于看清科研发展的蓝图。"我提醒他们,在计算机工程研究的圈子中,有哪些课题是最重要的,这样他们就不会浪费宝贵的时间在晦涩难懂的问题上。"

 

深度视觉实验室是贾教授设立的一个非正式团体,旨在汇聚香港以至海外等顶尖大学的计算机工程友好,共同探究关键论文和研究领域的最新进展,找出未来五到十年最需要解决的课题。

 

静水流深

 

贾教授正在解决其中一个最棘手的问题:如何衔接计算机视觉和自然语言处理(英文缩写为NLP)。"本质上,语言和视觉内容处理属于不同的研究领域,但它们正在融合,因为计算机视觉研究人员正在寻找NLP模型来处理视觉数据,也曾有一段时间,NLP 研究人员使用计算机视觉解决方案。"

 

若然取得研究成果,用户有望通过与计算机自然交谈来制作海报,而不是输入关键词来找海报素材,这当然知易行难。贾教授说:"解读视觉和语言编码信息的方式截然不同,衔接两者无疑是我当前最重要的任务之一。在不久的将来,我们将悉力在系统层面研发出最好的解决方案,这个过程涉及数十亿个训练参数。"

 

"我不怕困难,因为困难是创新过程的一部分。智慧技术能改善人的生活。希望我的榜样能够激励更多年轻人去探索新领域,创造社会价值。"

 

 

老师
我是 的搭档
联系我
已为您分配留学咨询顾问老师 ,请等待顾问老师和您联系。
如需更换老师进行咨询,请联系客服
400-183-1832
在线咨询
电话咨询