基于 Transformer 的命名实体识别 数据介绍根据train_TAG.txt统计得到的标签集如下:标签集大小为9。 模型框架模型结构模型使用hugging face的bert-base-chinese作为预训练模型。模型接受预处理后的字符序列作为输入,输出字符对应的标签。 模型参数BERT模型包含12层Transformer encoder,每层Transformer encoder包含的多头自注意头数为12,隐藏层大小为768。在构 Notes > 课程 > 自然语言处理
构建汉语词向量 代码逻辑首先对训练数据和测试数据进行处理,按词进行分割然后储存起来,然后通过SVG和SGNS方法计算出训练数据的词向量,再在测试数据上进行测试。为此,在代码中定义了load_data(), caculate_sim(), svd_embedding()和sgns_embedding()四个方法,分别进行数据处理、计算测试集上向量相关性、通过svd和sgns得到训练集上向量的操作。最后将输出结果按要 Notes > 课程 > 自然语言处理
词袋模型+SVM图像分类 算法流程描述首先,对数据集进行预处理。本实验使用scene_categories数据集,该数据集包括15个类别(文件夹名就是类别名),每个类中编号前150号的样本作为训练样本,15个类一共2250张训练样本;剩下的样本构成测试集合。对数据进行SIFT特征提取,得到每张图片的描述符,作为训练数据。然后,使用KMeans算法对SIFT特征进行聚类,得到视觉词汇,然后计算图像的词袋模型,将图像的词汇表 Notes > 课程 > 计算机视觉
钱币定位系统 算法整体流程为了实现钱币定位的功能,实验设计了Canny边缘检测和Hough圆变换两个主要的功能,最终实现了检测出输入图像中各个钱币的边缘并给出各个钱币的圆心坐标与半径的效果。 Canny边缘检测:该算法以原始图像的灰度图为输入,先对图像进行高斯滤波,使图像更加平滑,然后计算梯度,得到图像的梯度图。接下来,进行非极大化抑制,去除所有非边缘的点。最后,用滞后阈值法将比高阈值大、比低阈值小的像素保留为 Notes > 课程 > 计算机视觉
第二次实验 声纹识别实验模型:GMM(高斯混合模型)数据集:TIMIT GMM高斯混合模型(Gaussian mixture model)对于说话人识别,一组$N$个说话人集合,用一系列$GMM$ 示,即每个说话人$\mathrm{s}{\mathrm{k}}$ 对应一个$\mathrm{GMM}$ 参数 $\lambda{\mathrm{k}}, \mathrm{k}=1,2, \ldots, Notes > 课程 > 语音信息处理