人工智能文本分析专项职业能力考核规范

一、定义

运用工具从文本中选取特征,把从文本中抽取出的特征词进行量化来表示文本信息的能力。

二、适用对象

运用或准备运用本项技能求职、就业的人员。

三、能力标准与鉴定内容

能力名称:人工智能文本分析                            业领域:人工智能训练

工作任务

操作规范

相关知识

考核比重

(一)安装部署操作系统及服务

1.安装WindowsLinux操作系统

2.掌握Linux系统基本命令

3.能在WindowsLinux上安装、配置防火墙

4.能在WindowsLinux上进行包括文件管理、系统进行库配置、管理、差错、保证各种自带和新安装的系统服务正常运行

1.WindowsLinux操作系统基础知识及安装步骤操作

2.虚拟机原理

3.Linux基本命令使用

4.基本的防火墙知识和系统自带防火墙的基本配置

5.Shell脚本的基本知识,文件管理、库管理、库依赖关系等Shell命令

5

(二)理解统计理论基础

1.掌握统计学基本知识

2.理解向量空间、线性空间和欧式空间的概念

3.掌握行列式与矩阵的计算

4.掌握一般的描述性统计方法

5.能使用概率统计描述数据的规律

1. 线性变换的基本知识

2.向量空间的基本概念

3.统计描述方法

4.概率预测及假设检验知识

10

(三)检索

数据信息

1.能安装和卸MySQL

2.能熟悉MySQL数据库的结构和基本数据类型

3.能完成MySQL创建、修改、删除、查询语句

4.能使用MySQL函数查询内容建立多表之间的关系,完成多表查询

5.能完成MongoDB的常规操作

6.能使用Python操作MongoDB

7.能对上述1-6中出现的错误指令进行处理及解决

1.关系型数据库MySQL数据库基础知识

2.MySQL数据库与数据表结构信息

3.MySQL数据库定义语句、操作语句内容

4.非关系型数据库MongoDB的基础知识

5.MongoDB的操作内容和常用语句方法

15

(四)搭建数据处理体系框架

1.能搭建Python开发环境

2.能完成Python基础代码的编写

3.能理解TensorFlow基本数据结构

4.能用TensorFlow实现代码结构和开发步骤

5.会面向对象编程

1.Python编程基础编程知识

2.流程控制与数组

3.文件处理

4.函数、模块与类

5.并发编程

6.TensorFlow基础知识

20

(五)处理数据

1.会使用Python库(NumpyPandasseaborn)处理基本的数据

2.能掌握基础算法(朴素贝叶斯、逻辑回归、KNNSVMKmeans)的基本原理

3.能理解神经网络结构及算法的基本逻辑原理

4.能使用Python代码实现基础算法模型,完成数据处理分析

1.Python常用库的基本内容

2.神经网络结构的基础知识结构和算法原理

3.基础算法的原理和实现代码

25

(六)分析文本数据信息

1.能理解语言统计模型(马尔科夫假设)

2.能运用词向量的逻辑将文本转换为数值

3.能使用Python常用分词工具(如JiebaGensim)实现关键词提取和中文分词

4.能掌握文本分析的常用分类算法模型和聚类算法模型

5.能使用算法模型完成文本的分类和聚类

6.能构建文本分析的主题模型

7.会使用情感分析模型对对文本打分

1.词向量及分词的基础知识

2.常用算法模型的原理和代码

3.主题分析模型的构建过程

4.情感分析模型应用涉及到的知识

25


四、鉴定要求

(一)申报条件

达到法定劳动年龄,取得大专(含尚未取得毕业证书的应届毕业生)及以上学历,具有计算机操作能力的人员。

(二)考评员构成

考评员具备关于人工智能文本分析的基础理论知识和实践操作能力;每个考评组不少于3名考评员。

(三)鉴定方式与鉴定时间

技能操作考核采取现场上机操作方式。技能考试时间为120min

(四)鉴定场地设备要求

考场面积不小于60㎡,操作场地光线充足,整洁无干扰,具有安全防火措施。满足技能鉴定需要的软硬件环境,包括台式计算机(至少具备两套操作系统)、光纤交换机、核心交换机、边界防火墙,水电等基础设施良好。