整数有约 | 彗光科技 x 整数智能:科技赋能突破视障教育壁垒
在科技日新月异的今天,教育的公平性和可及性依然是一个亟待解决的社会难题。对于视障群体而言,传统的教育资源和手段往往无法满足他们的学习需求。彗光科技作为一家致力于视障教育技术创新的企业,正在通过前沿的科技力量,帮助盲人群体跨越教育障碍。本期整数有约,我们邀请到了来自浙江大学软件学院的于智老师,他作为彗光科技创始人,与我们分享了彗光科技如何通过大模型与数据的科技赋能,克服视障群体教育的重重困难,助力视障群体更好地融入社会,实现价值。
嘉宾介绍

于智,浙江大学软件学院副教授,博士生导师,1988年8月出生,吉林扶余人。2006年至2016年在浙江大学计算机学院完成本科到博士的学习过程,2016年7月至2020年6月在浙江大学从事博士后研究工作。2020年6月起为浙江大学软件学院教师。
于智老师的主要研究方向为人工智能与信息无障碍技术,对于系统开发与算法研究具有丰富经验,面向视障人士和相关从业人员的实际业务痛点,打造助盲普惠教育综合解决方案,设计研发软硬件产品,帮助视障人群改善学习、生活等现状。参与国家基金重点项目2项,面上项目2项,主持横向项目6项,获浙江省科技进步一等奖。参与制定国家标准2项。获ACM-ICPC程序设计竞赛亚洲金奖2次。
1. 彗光科技:从学术到实践的跨越
彗光科技的创立源自于智教授在学术领域的耕耘和相关的研究经验积累,以及在助盲工作中遇到的现实痛点。
自2016年起,于智老师就在实验室进行信息障碍相关的研究,专注于图像识别和数据处理。他最初的工作服务对象就是是盲人群体,并与达摩院长期合作,也使得他的研究取得了初步进展。然而,真正促使他成立企业并将技术应用到实际生活中的契机,来自于一次疫情中的特殊经历。
“我们需要把技术转换成一个实际落地的应用,才能更好地服务盲生学习,于是我们从这个角度出发,开始做的这个事情。”
2020年疫情期间,在和盲校的合作过程中,一位盲生家长的求助让他意识到视障学生疫情居家学习的特殊时期,面临着巨大的挑战——由于缺乏适合的学习材料、设备与辅助技术,盲生在家隔离期间无法继续跟上课程进度,影响了他们的学业成绩。这位学生本来克服重重困难,在十几年的学习中通过自己的努力和家人老师的全力支持与帮助,始终保持着优异的学业成绩,并有望参加高考,获得比较顺利的未来发展道路。但对于这样一位学生而言,疫情居家隔离带来的挑战,不仅是短期内无法跟上教学进度,更是多年来成倍的努力和坚持在高考前功亏一篑,如果这样下去,这位学生基本上就丧失了他在高考中的竞争力。对于家长而言,这不仅是金钱、时间和精力的问题,没有了盲文学习资料,家庭辅导和学习也无法推进,求助无门,家长找到了之前盲校合作中认识的于智教授。
正是这一情境激发于智老师将技术转化为助盲教育产品的想法。他决定利用自己在图像识别领域的研究成果,开发一个真正能帮助视障学生进行居家学习的解决方案,从而催生了彗光科技的成立。
2. 大模型助力盲文翻译与教育:解码彗光产品技术架构
彗光科技的核心产品包括“汉盲双向翻译平台”和“盲文刻印机”,这两款产品都是彗光科技基于自研的人工智能大模型搭建,旨在解决视障学生教育过程中遇到的教学材料稀缺和对视障学生教学辅导中的沟通问题。尤其是在汉盲翻译的技术应用上,彗光科技充分利用了人工智能、大语言模型以及数据分析的独特优势。
“首先他们是能用明文给孩子出盲文题目,利用实现明文到盲文的翻译;同时孩子作答的作业他也能批改,就要实现盲文到明文的翻译,这是我们的产品的独到之处,我们是唯一一个支持双向翻译的汉盲翻译平台。”
彗光科技汉盲双向翻译平台区别于已有的汉盲翻译平台的最大特殊优势在于能够支持汉字与盲文之间的双向转换,除此之外,它不仅能实现普通文字与盲文之间的双向翻译,还能处理如数学公式、英语、化学公式等特殊内容的转换。传统的汉盲翻译平台大多仅支持普通文本的转换,而彗光科技的创新之处在于它能够处理涉及表格、公式等复杂元素的多元翻译,这对于涉及多种语言、大量图表公式的教学材料和考试资料的汉盲互译是必不可少的。
这一翻译平台的核心技术依赖于两个大语言模型:汉盲大模型和盲汉大模型。汉盲大模型负责将输入的汉字和特殊符号(如数学公式、化学符号等)转换成盲文,而盲汉大模型则承担将盲文翻译回普通文字的任务。与普通的直译系统不同,彗光科技的系统需要深刻理解上下文和语义。例如,当字母“C”出现在数学公式“COS”中时,其翻译应与单独出现的字母“C”有所不同。
此外,盲文的翻译还涉及图像识别技术。在盲文到普通文本的转换中,尤其是盲生的作业和试卷,涉及大量涂改和正反面识别,这对图像识别技术提出了更高要求。通过对盲文点的涂改、旋转、冗余等细节的深入分析,彗光科技的模型能够更准确地识别盲文内容,确保翻译的准确性。
“我们需要采集的数据量跟普通的文字数据采集相比,数据量需求还要更大得多,因为我们需要大量的人工写的文字,同时教育环境下还会出现许多的主观错误和涂改的情况。”
在开发过程中,数据的采集与标注对于产品性能的实现至关重要。由于盲文的特殊性,盲生的作答可能涉及到大量的涂改和正反面变化,这使得盲文数据采集的难度大大增加。因此,彗光科技不仅利用传统的数据来源,还与整数智能等合作伙伴共同对搜集到的数据进行数据增强,通过数据合成和错误模式的识别,提升了模型的鲁棒性。
在数据采集和分析的过程中,彗光科技还遇到了一些挑战。比如,由于考试试题和习题通常是非公开的,如何获取足量的高质量数据进行训练成了一个难题。为了解决这个问题,彗光科技通过与整数智能的合作,对训练数据进行了数据扩充,并采用数据增强的方式,成功克服了数据不足的瓶颈。
3. 未来发展:从教育到就业的全面拓展
“我们想做的事情其实就是帮助盲人能够和普通人一样正常地生活,这是最好的结果。当然教育是第一个环节,教育之后还有就业,我们正在尝试从教育往更多的领域拓展。”
展望未来,彗光科技并不满足于仅在教育领域的成就。于智表示,未来的发展将重点放在更多应用场景的拓展和产品的技术迭代上。目前,彗光科技的双向翻译平台和盲文刻印机已经在家庭教育领域取得了显著的应用,许多家庭已经开始使用这些产品为视障学生提供实时更新的教材和试卷。然而,这仅仅是公司长期愿景的起点。
随着技术的成熟,彗光科技已经开始将产品推广到公共场所,如门把手、开关等公共设施的盲文标识,并开展盲文检查服务。彗光科技也在不断进行产品迭代和技术创新。公司计划通过多模态大模型的引入,进一步减少人工干预,实现盲文翻译和刻印的自动化,未来的产品也将更加智能化,能够在更复杂的教育和工作场景中提供帮助。
对于彗光科技来说,帮助盲人群体实现“无障碍”生活是最终的目标。除了教育,未来公司还计划深入探索盲人在社会各个方面的需求,尤其是在就业方面,因此,彗光科技还积极研发针对盲人在工作场景中的产品应用。例如,电话客服行业中,视障人士通常无法同时接听电话和查看话术模板,彗光科技正在通过技术帮助他们实现这一操作,从而拓宽盲人的就业机会。
通过为盲人提供更为便捷的信息传递工具和支持技术,彗光科技希望为他们创造更多的就业机会,帮助他们更好地融入社会,帮助视障人士真正融入到普通人的生活中,能够用更加多元、更加便捷的方式,实现属于他们的价值。
整数智能信息技术(杭州)有限责任公司,起源自浙江大学计算机创新技术研究院,致力于成为AI行业的数据合伙人。整数智能也是中国人工智能产业发展联盟、ASAM协会、浙江省人工智能产业技术联盟成员,其提供的智能数据工程平台(MooreData Platform)与数据集构建服务(ACE Service),满足了智能驾驶、AIGC等数十个人工智能应用场景对于先进的智能标注工具以及高质量数据的需求。

目前公司已合作海内外顶级科技公司与科研机构客户1000余家,拥有知识产权数十项,通过ISO9001、ISO27001等国际认证,也多次参与人工智能领域的标准与白皮书撰写,也受到《CCTV财经频道》《新锐杭商》《浙江卫视》《苏州卫视》等多家新闻媒体报道。

