软件定义汽车时代,SOA成为软件架构发展的关键词。但“如果SOA涉及的原子服务组合还只能基于规则,只能依靠人力编排,那其实沿用的还是信息化时代的生产方式,没有用数据去驱动算法,这种SOA就是没有灵魂的SOA。”智协慧同联合创始人兼CEO鲍鹏表示。
在鲍鹏看来,SDV时代的核心建设要点在于数据敏捷+工具链的组合运用。可以用工具链封装车云异构,让业务部门可以灵活利用这些数据探索新业务,实现快速试错、验证、最终达成数据闭环。
(资料图)
鲍 鹏 | 智协慧同联合创始人兼CEO
以下是演讲内容整理:
最近,横空出世的ChatGPT大语言模型在科技圈空前火热。过去,人工智能更像鹦鹉学舌,知其言而不懂其意;如今,ChatGPT可以像乌鸦一样,进行总结、推理和进化。这样新模型的出现带来了极大的生产力提升,同时也伴随着极大的竞争力和破坏力。
信息时代,软件功能需要程序员想清楚架构,写出来程序。而智能时代,越来越多的功能不是由程序员编写。自动驾驶、执行器等某些基本功能实现依然需要写代码,但同时会引用算法和模型,算法和模型就不是由程序员的逻辑写出来了,其复杂度极高。像ChatGPT如此多的参数,已经不可能由编程实现,而是由数据闭环实现。
以软件定义汽车为例,在SOA的路径上,把车内大量的服务进行了原子化封装,在这之上搭建开发环境。同等重要的是必须要引入数据开发环境和数据闭环能力,在SOA的框架上,没有数据驱动的智能是没有灵魂的。由此可见,数据占据十分重要的地位。如今OEM在云上存了很多的数据,但是这些数据是低质量的,本质上没有用,除了满足法规的需要外,还没有真正的驱动业务。
数据底座构建先进生产力
如何在新架构上为智能汽车打造数据底座?本质上要为智能汽车打造一套先进的数据工具链,先进的工具链代表着先进的生产力。先进的工具链应该屏蔽掉数据跨车云的各种技术复杂性,业务部门需要什么数据,车里的数据就可以传输到桌面立刻使用,然后再高效的把结果回传到车上,形成闭环。
所以工具链的目标是实现高效和敏捷。基于这个目标可以把数据的能力分成四层。
第一层,数据到桌面,能不能灵活的使各个业务部门获取需要的数据是关键;
第二层,有了数据之后,传统方式还需要IT背景的人进行编程,能不能更高效敏捷的加工这些数据;
第三层,将加工后的成果和认知快速的反馈到车上进行迭代,以此驱动内部业务。
第四层,当把内部的业务驱动做好后,开放这个能力。让更多的合作伙伴进入环境中,给他们开一个账号,在可受限的环境里迭代其功能和算法。
当然在设计这些工具链时,也会有一些机遇和挑战。不同于传统的IOT架构,今天的车本身就是移动的算力网,它的架构从传统的IOT架构变成了车云计算的架构,意味着边缘计算的灵活性和能力变得更重要;边缘的存储,数据从文件存储到时序数据库存储,被处理被查询,而不是数据全部上云。同时今天法规也在加强这个能力,我们已经看到很多基于数据采集的相关法规出台,原则上很多的数据非必要不出车,尽量车内存储车内计算,如果要出车需要做到很多的合规。
但在SOA、域控的架构之上把这四层能力搭建起来的挑战也很大。
第一个挑战是数采能力差成本高。机器数据是价值密度很稀疏的数据集,只有跟异常工况相关的数据是有用的。如果把全部的数据上云,不单单是流量费的增加,大量无用的数据到了后台也是存储成本、计算成本的累加。越来越多业内客户和我们达成了一致,要构建一套灵活、高精度数据上云的能力。
第二个挑战在于车云技术环境的不同。跨车云的处理数据技术异构,开发、测试、部署效率很低。另外,车上的硬件不同,EE架构在细节上、通信网络都不同,这种情况下很多数据驱动的算法面临的是,每上一款车需要花4-6个月的时间去集成,效率又变得很低了。
我们希望帮助客户提供一套先进的工具链和基础的中间件软件,只针对数据闭环一个场景、不涉及功能,以解决四层设计过程中面临的各种挑战。在这个过程中,车端有自己的数据库,未来EE架构设计时会考虑数据架构,考虑数据架构时希望的是车里的各种服务可以在车端对数据进行处理、查询、使用,这意味着在车端要有一个数据库。
智能汽车数据底座的设计思考
我们写了一个数据库,在边缘计算的基础上提出了车云计算,对计算过程做了低代码化。这里讲一下我们的四层。
第一层,灵活的数据获取能力。两年前,我们做到了行业里第一个10毫秒级别5000多个信号以灵活的方式上云。在客户的推动下,后来又帮助客户把非结构化的数据实现触发式的上云。我们用中间件快速帮客户在4-6月的时间里在量产车上实现了定义和下发,去触发回传。同时帮助他们搭建影子模式,包括传感器的比较、人和车的比较。在影子模式之前做驾驶员的评价体系;人和车比较时,一定要对驾驶员进行筛选,过了驾驶分的驾驶员把他们介入白名单进行比较。
第二层,数据的加工能力,在SOA架构上怎么搭建数据的加工能力。延续前面关于驾驶分的话题,驾驶分里首先要对驾驶行为进行特征提取,对视觉上ADAS的数据、车道线、车速等信号做特征提取,举例来说提取出并线过程中就有二三十个维度,有了这些特征数据集就可以对一个人的并线行为进行定量分析。在开发并线特征时,我们向客户证明了,过去在车端用嵌入式的语言编写大概需要800行代码进行一周的测试。而在低代码环境下做同样的事情只需要5行的表达式、半天的时间,带来极高的效率提升。
第三层,数据闭环的能力,我们希望除了对数据做一些后台分析,还能促进数据驱动功能的演进。我们的客户用我们的数据底座去开发引入机器学习的功能,用机器学习的算法识别减速带,通过众包的方式把减速带的数据回传到云端。用传统的方案做这个事情花了大半年的时间,有了数据底座后同样的事情一个月即可实现。
在效率上有如此大提升的原因在于,我们做了一套车云同构的计算框架,有两套算子,在车端是嵌入式的、云端有现成的算子库。通过一套低代码的业务语言,快速构建数据处理、算法开发搭建,然后把算法发到车上。
第四层,做完前三层之后,帮助客户构建数据驱动他们内部的研发,OEM做成熟之后可以开放给供应商,目前已经有客户在做类似的规划。最终我们客户期望的是除了车上的功能自研之外,有更多的功能开放给合作伙伴,有合作伙伴用整车数据;用海量的数个车型积累的数据集做快速的算法开发和迭代。
关于智协慧同
我们公司是相对跨界的公司,有IT技术、数据库、传统汽车电子背景。我们为行业提供了基础的工具链和中间件,有一套跨车云的计算环境,在此之上有一套低代码的算法开发工具。核心的目标是提高效率、实现敏捷。
2021年,我们拿到第一个量产项目,到今年已经拿了10个以上车型的量产定点。做这件事的同时我们还做了很大的成本降低。比如数据上云后不只是做简单分析,而是形成闭环,包括支持创新。我们非常有信心帮助更多的客户构建数据底座,在1-4层数据驱动业务的过程中伴随更多的客户打造自己内生的能力。
(以上内容来自智协慧同联合创始人兼CEO鲍鹏于2023年3月14日-16日在2023第四届软件定义汽车论坛暨AUTOSAR中国日发表的《数据智能演化路径:从数据底座到数据生态》主题演讲。)