权威可信的企业应用程序综合服务机构 www.cabs.org.cn

首页最新发布

最新发布

探索人工智能之旅:人工智能团队的剖析

时间:2018-08-06 15:12:42

首先定义项目所需的技能和帮助。在此过程中,可能会确定以下情况适用:

自行构建AI应用程序并明确定义项目需求但需要其他个人贡献者的专业技能来加速项目时间表或实现更高质量的产品。

自身为产品经理或有远见者,但需要更全面的技术帮助来全面定义项目需求,包括确定项目规格,工具和技能。

如果想构建的应用程序是主流的,不需要大量的研究和狭义的专业知识,但仅仅是人工智能在特定领域的应用团队如何组成是可预测的。

以下讨论概述了您可能需要的团队成员的个人资料。

角色

添加到团队中的人员很大程度上取决于要构建的项目类型。可能只需要一个贡献者或更多的人。

数据科学家

数据科学家通常具备以下所需技能:

算法设计和分析

线性代数

概率论

数学统计

脚本语言(主要是Python *)

数据建模语言(主要是Python,R *,MATLAB *,Mathematica *)

数据管理语言(SQL及其衍生物,如Pig *和Hive *)

机器学习(分类,回归和聚类)

关系数据库(PostgreSQL *,MySQL *,Oracle *)

版本控制(例如,Git *)

额外的所需技能可能包括高级机器学习(主题建模,搜索,图挖掘,矩阵分解,时间序列分析,结构化学习等)。

从理论上讲,数据科学家可以在任何项目工作。然而,要求具体行业的经验是有意义的,例如银行信用评分,数字广告或搜索引擎。数据科学家可能参与的项目包括:

建立离线评分模型(信用,流失,购买产品的倾向等)

执行数据集(客户端,产品,事务等)的脱机集群

推荐引擎

词性标注,实体检测

情绪分析

时间序列预测

点击率(CTR)预测

深度学习数据科学家

一位专门从事深度学习的数据科学家通常需要以下技能:

深度学习理论,如word2vec,卷积神经网络(CNN),递归神经网络,长期短期记忆网络(LSTM)和生成对抗网络

深度学习框架,例如TensorFlow *,Caffe *,Theano *,MXNet *,Torch *或Keras *

像数据科学家一样,深度学习专家专注于不同的领域。例如:

计算机视觉,需要有关CNN的知识

自然语言处理和文本挖掘需要知道递归神经网络,LSTM网络,门控循环单元(GRU)和word2vec

音频处理(语音,音乐)和机器翻译,需要知道递归神经网络(LSTMs,GRUs)

时间序列分析,需要有关CNN和循环神经网络(LSTM或GRU)的知识。

典型的项目包括:

从图像中检测物体

图片标记

在视频流中进行目标跟踪

机器翻译

语音到文本和语音生成

字相似性

AI用于自驾车

音乐一代

数据分析师

数据分析师包含与数据科学家相同的所需技能。数据分析师可以从事描述性数据分析工作,但对预测分析(例如机器学习(分类,回归和聚类)和数据挖掘)可能不太适应。

典型的项目包括:

指标和报告

构建分析仪表板

传统的建模任务(例如,用户基础分段,分类或回归)

数据工程师

这个角色直接关系到大数据的概念。数据工程师可以使一个机器学习算法按比例为一个非常大的数据集工作。虽然数据工程师的技能与数据科学家的技能重叠,但还是有一些关键的区别。

所需技能包括:

算法设计和分析

脚本语言(主要是Python)

熟悉机器学习理论(分类,回归或聚类)

分布式机器学习框架(Spark *,Storm *,H2O.ai *)

数据管理语言(SQL及其衍生物,如Pig和Hive)

关系数据库(PostgreSQL *,MySQL *,Oracle)

分布式系统和NoSQL *数据库(Hadoop *,Cassandra *,HBase *,Riak *,Kafka *,Dynamo *,Redis *,MongoDB *或ElasticSearch *)

版本控制(例如,Git)

云计算(例如,Amazon Web Services *,Microsoft Azure *或Google Cloud *)

的Linux *

数据工程师通常熟悉容器技术,例如Docker *。典型的项目包括超过100 GB的数据集,必须通过流传输来处理,例如IT传感器,视频或音频。

开发运营(DevOps)工程师

此人维护项目的基础设施,需要扎实的软件工程技能,操作系统知识,分布式系统和云计算。

所需技能包括:

算法设计和分析

脚本语言(主要是bash)

关系数据库(PostgreSQL *,MySQL,Oracle)

分布式系统和NoSQL数据库(Hadoop,Cassandra,HBase,Riak,Kafka,Dynamo,Redis,MongoDB或ElasticSearch)

版本控制(例如,Git)

云计算(例如Amazon Web Services,Microsoft Azure或Google Cloud)

Linux的

容器技术(例如Docker)

计算机网络(例如,TCP / IP协议或DNS)

计算机安全(SSH协议或VPN)

持续部署(Travis)

期望的技能包括:

数据管理语言(SQL及其衍生物,如Pig和Hive)

API设计

典型的项目是协调集群中的机器或配置一致的可移植开发环境。

额外的关键角色

在软件工程项目中还有几个更重要的传统角色。以下简要介绍他们的职责范围和对项目的预期贡献。

软件工程师(后端)

帮助构建API,配置数据库并编写业务逻辑(例如付款、认证、通知或消息)。一些现代技术可以查找Node.js *,Flask *,Django *,Ruby on Rails *,Akka *,Spray *,Go *,PostgreSQL *,MySQL *,MongoDB *,Redis,RabbitMQ *和Docker *。

软件工程师(Web前端,手机)

为支持交互性的应用程序构建用户界面。 React.js *,Angular.js *,D3.js *,Vue.js *,Node.js *,HTML,JavaScript *,CSS,Bower *,Gulp *,Less *,Bootstrap * ,和jQuery *。

设计师

侧重于用户体验或图形设计,或两者兼顾。通常会创建一个初始原型,与产品经理协作以便与用户一起测试,并为前端工程师准备最终材料。一些现代技术要查找的是Adobe Photoshop *,Sketch *和InVision *。

产品经理

设定产品愿景,与用户合作定义产品规格,并确保所有事情都很好地结合在一起。理想情况下,这个人也可以承担系统架构师的责任并定义技术规范。

项目经理

协调所有团队成员,确保达到最后期限,消除妨碍项目工作的障碍,与产品所有者或业务客户进行沟通,定义项目路线图,选择团队使用的工具以及其他不可见但重要的团队基础设施工作。

系统架构师

将产品规格和愿景转换为技术规格和工程任务以供团队执行。通过准确定义API,依赖关系等,确保所有组件都能够融合在一起在整合过程能够平稳运行。必须是从开始到结束管理至少几个软件项目的团队中的高级人员。

特定领域专家

对特定行业或垂直行业有深刻的理解。通常,来自领域专家的信息在用于机器学习和数据注释的特征工程中是有用的。

质量保证分析师

确保应用程序符合所有声明的规范并完美地工作。质量保证分析师通常包含在具有交互性或用户界面的项目中。还可以检查机器学习模型的输出,并与团队中的数据科学家和数据注释专家一起执行错误分析。

团队组成框架

现在您知道所涉及的角色和技能了,让我们看看一组指导性问题,

可以使用这些问题帮助确定您的团队需要哪种专业人员。

它是一个AI还是数据项目?

如果是,请添加数据科学家或数据分析师。

您的项目是否包含图像,语音,视频或大型文本集合?

如果是,请添加一位理想的深度学习数据科学家。

你需要自己准备项目的数据吗?

如果是,则添加一个域专家进行数据注释。

您的应用程序是否可以使用非常大的数据集并且必须承受高负载?

如果是,请添加数据工程师。

您的应用是否可以离线或在线工作?

如果在线,请将DevOps工程师或软件工程师(后端)添加到项目中。数据工程师可能会在线应用程序部署。

你的应用程序是否有用户界面?

如果是,请添加一位前端工程师和一位设计师。

你的应用有多少个组件?

如果不止一个,请添加系统架构师,质量保证分析师,并将数据科学家的数量乘以组件数量。

你的团队有多少人?

如果您至少有三个人,请添加项目经理。

如第1部分所述,电影制作应用使用图像处理(情感识别)算法从上传的图像中提取情感,生成表示提取的情绪的音乐,然后创建结合图像和音乐的电影。

鉴于这些信息,让我们应用上面定义的框架:

它是一个AI还是数据项目?

AI

您的项目是否包含图像,语音,视频或大型文本集合?

是。

你需要自己准备项目的数据吗?

是。

您的应用程序是否可以使用非常大的数据集并且必须承受高负载?

没有。

您的应用是否可以离线或在线工作?

线上。

你的应用程序是否有用户界面?

是。

你的应用有多少个组件?

二。

你的团队有多少人?

九。

基于以上信息,该项目的理想团队如下:

两名深度学习数据科学家

一名项目经理,系统架构师或设计师

一名后端软件工程师

一位前端工程师

两位领域专家

一位质量保证分析师

由于该项目很小,应用程序的功能并不复杂,因此产品经理,系统架构师和设计师的角色被合并为一个。考虑到这一点,让我们继续进行专家搜索过程并分析可用于查找这些专家的渠道。

人才招聘渠道

由于人工智能和深度学习是个充满活力的行业,对如何在这个领域组建强大团队知之甚少,因此至少要列举现有的招聘渠道。分为内部和外部渠道。

在大型组织中,专家搜索从内部开始。如果某些所需的专家在内部找不到,搜索将扩展到市场。

寻找内部人才

建议与人力资源团队联系,用上面定义的角色协作定义职位描述和理想的候选人档案。人力资源团队通常使用以下搜索方法:

在内部工作板上做广告

在一个面向公众的公司公告板上做广告

向相关团队(例如,AI团队或AI开发人员传福音)询问