人工智能文本分析专项职业能力考核规范
一、定义
运用工具从文本中选取特征,把从文本中抽取出的特征词进行量化来表示文本信息的能力。
二、适用对象
运用或准备运用本项技能求职、就业的人员。
三、能力标准与鉴定内容
|
能力名称:人工智能文本分析 业领域:人工智能训练师 |
|||
|
工作任务 |
操作规范 |
相关知识 |
考核比重 |
|
(一)安装部署操作系统及服务 |
1.安装Windows、Linux操作系统 2.掌握Linux系统基本命令 3.能在Windows、Linux上安装、配置防火墙 4.能在Windows、Linux上进行包括文件管理、系统进行库配置、管理、差错、保证各种自带和新安装的系统服务正常运行 |
1.Windows、Linux操作系统基础知识及安装步骤操作 2.虚拟机原理 3.Linux基本命令使用 4.基本的防火墙知识和系统自带防火墙的基本配置 5.Shell脚本的基本知识,文件管理、库管理、库依赖关系等Shell命令 |
5% |
|
(二)理解统计理论基础 |
1.掌握统计学基本知识 2.理解向量空间、线性空间和欧式空间的概念 3.掌握行列式与矩阵的计算 4.掌握一般的描述性统计方法 5.能使用概率统计描述数据的规律 |
1. 线性变换的基本知识 2.向量空间的基本概念 3.统计描述方法 4.概率预测及假设检验知识 |
10% |
|
(三)检索 数据信息 |
1.能安装和卸MySQL 2.能熟悉MySQL数据库的结构和基本数据类型 3.能完成MySQL创建、修改、删除、查询语句 4.能使用MySQL函数查询内容建立多表之间的关系,完成多表查询 5.能完成MongoDB的常规操作 6.能使用Python操作MongoDB 7.能对上述1-6中出现的错误指令进行处理及解决 |
1.关系型数据库MySQL数据库基础知识 2.MySQL数据库与数据表结构信息 3.MySQL数据库定义语句、操作语句内容 4.非关系型数据库MongoDB的基础知识 5.MongoDB的操作内容和常用语句方法 |
15% |
|
(四)搭建数据处理体系框架 |
1.能搭建Python开发环境 2.能完成Python基础代码的编写 3.能理解TensorFlow基本数据结构 4.能用TensorFlow实现代码结构和开发步骤 5.会面向对象编程 |
1.Python编程基础编程知识 2.流程控制与数组 3.文件处理 4.函数、模块与类 5.并发编程 6.TensorFlow基础知识 |
20% |
|
(五)处理数据 |
1.会使用Python库(Numpy、Pandas、seaborn)处理基本的数据 2.能掌握基础算法(朴素贝叶斯、逻辑回归、KNN、SVM、Kmeans)的基本原理 3.能理解神经网络结构及算法的基本逻辑原理 4.能使用Python代码实现基础算法模型,完成数据处理分析 |
1.Python常用库的基本内容 2.神经网络结构的基础知识结构和算法原理 3.基础算法的原理和实现代码 |
25% |
|
(六)分析文本数据信息 |
1.能理解语言统计模型(马尔科夫假设) 2.能运用词向量的逻辑将文本转换为数值 3.能使用Python常用分词工具(如Jieba、Gensim)实现关键词提取和中文分词 4.能掌握文本分析的常用分类算法模型和聚类算法模型 5.能使用算法模型完成文本的分类和聚类 6.能构建文本分析的主题模型 7.会使用情感分析模型对对文本打分 |
1.词向量及分词的基础知识 2.常用算法模型的原理和代码 3.主题分析模型的构建过程 4.情感分析模型应用涉及到的知识 |
25% |
四、鉴定要求
(一)申报条件
达到法定劳动年龄,取得大专(含尚未取得毕业证书的应届毕业生)及以上学历,具有计算机操作能力的人员。
(二)考评员构成
考评员具备关于人工智能文本分析的基础理论知识和实践操作能力;每个考评组不少于3名考评员。
(三)鉴定方式与鉴定时间
技能操作考核采取现场上机操作方式。技能考试时间为120min。
(四)鉴定场地设备要求
考场面积不小于60㎡,操作场地光线充足,整洁无干扰,具有安全防火措施。满足技能鉴定需要的软硬件环境,包括台式计算机(至少具备两套操作系统)、光纤交换机、核心交换机、边界防火墙,水电等基础设施良好。