软件工程论文

您当前的位置:学术堂 > 计算机论文 > 软件工程论文 >

集人工智能、Python网络爬虫及批量文件处理的综合应用案例

来源:电脑知识与技术 作者:马文秀 李焱
发布于:2021-08-30 共2319字
  本篇论文快速导航:
第1-2篇 关于python的论文(最新范文6篇)
第3篇 Python语言在固定资产投资项目财务评价中的初探
第4篇 Python的英语搭配助手应用开发研究
第5篇  Python在国内外市场中的广泛应用
第6篇 集人工智能、Python网络爬虫及批量文件处理的综合应用案例

展开更多

  关于python的论文第六篇:集人工智能、Python网络爬虫及批量文件处理的综合应用案例

  摘要:随着人工智能时代到来,生活中随处可见人工智能的应用。Python语言是人工智能开发的主流语言,现阶段几乎所有高校都开设了Python程序设计课程,如何在教学中设计一系列有趣有用接地气的案例尤为重要,既可体现Python生态语言的特点,又能融入常用人工智能的应用。目前诸多科技公司都搭建了AI应用架构平台,其中百度AI的开放平台具有功能全面且前沿,为开发者提供的技术文档也最全面。本文设计了一系列基于百度AI平台用Python语言完成的人工智能应用,程序由简到难,由单一功能模块到综合应用的开发,循序渐进,让学生逐步领会、掌握Python人工智能的应用开发。

  关键词:人工智能;百度AI平台; Python程序设计; AI开发能力;案例教学;

  1 简单的人工智能应用案例

  学生通过简单设置即可启用百度AI开发能力。首先登录百度AI平台,注册百度账号。账号登录成功即可选择需要的人工智能服务如:图像识别、人脸识别、语音技术等项目。接着在对应AI服务中创建应用,获取密钥API Key及Secret Key,程序中将通过密钥凭证调用对应接口的AI能力。

  教师要指导学生认真阅读百度Python SDK技术文档,技术文档是程序开发者的宝典,在百度Python SDK文档里详细介绍了Python的baidu-aip开发环境配置。常用方法是使用pip install baidu-aip安装即可[1]。

  1.1 基于百度AI的图像识别案例

  图像识别是人工智能最常见的应用之一,Aip Image Classify是图像识别的Python SDK客户端,为图像识别的开发提供了一系列的交互方法。首先参考如下代码新建一个Aip Image Classify:(图1所示)

1.png

  案例1公众人物的识别。程序要求使用百度AI平台,编写图像识别应用程序。输入一张照片,识别照片公众人物信息,并输出识别结果。主要程序代码参考(图2所示):

1.png

  可以进一步鼓励学生对案例1进行举一反三的程序编写,通过改变client的参数,进行动物识别client.animal Detect、菜品识别client.dish Detect等。

  该案例代码只有十来行,且没有循环、分支结构,对于计算机语言的初学者也非常适合。

  1.2 基于百度AI的人脸识别案例

  案例2输入一张图片,检测是否有人脸存在,若检测到则输出人脸属性的相关数据,如年龄、性别、颜值、表情等信息。

  通过本案例,了解人工智能在人脸识别及人脸属性检测领域的应用。首先创建百度AI平台人脸识别应用,获取该应用的密钥,调用百度AI人脸检测接口。参考部分主要代码如下(图3所示):

1.png

  2 进阶的人工智能应用案例

  在进一步人工智能应用案例里需要从百度AI识别结果中提取出识别物的关键词,这就涉及Python组合数据类型字典型、列表型的综合应用,以及json格式数据的编码解码等操作。

  2.1 百度AI识别结果数据分析

  案例3从菜品识别结果中提取出关键词信息,如菜品的名称、菜品热量calorie以及该菜品百度百科简介等关键信息。并把这些AI识别关键信息写入到以菜品名称命名的txt文件中。

  此案例为案例1的进阶,AI识别结果数据类型为字典dict。此处练习对字典类型键值对的操作。也可将字典数据转换为层次清晰便于阅读的json格式字符串,进行数据保存。参考部分主要代码如下(图4所示):

  学生可以进一步对案例3进行举一反三练习,如识别电影明星的详细演艺生涯介绍,以及识别商品Logo及品牌背后的故事等。

  2.2 百度AI识别结果关键词写入到图片

  案例4在人脸属性检测应用中,用矩形框框选人脸,并在上方显示年龄、性别及颜值。如果图片中存在多张人脸,请分别识别标出。

  此案例是对案例2的进阶,如何将人脸识别数据写入图片这需要结合Python图像处理库PIL完成。此案例需要导入PIL库的三个模块,Image模块用于打开图像、显示和保存图像。ImageFont模块用于设置写入图像文本时用到的字体字号。Image Draw模块提供了对图像的绘制功能,如在图像上画矩形、写文本等。

  3 集人工智能、Python网络爬虫及批量文件处理的综合应用案例

  3.1 百度AI图像识别、批量文件遍历及文件夹操作综合应用

  案例5自动识别一批图片,并将识别出的图片进行分类整理。根据识别结果,按分类名称建立文件夹,并存入同类型图片。以识别名称命名处理后的图片,且把识别结果的百度百科描述信息存入相应的文本文件。

  本案例需要处理批量文件,可以使用Python的enumerate函数遍历指定目录下所有文件,程序判断若为图片文件则调用百度AI进行图像通用识别advanced General,再通过对识别结果组合数据类型的操作提取识别关键词:名称、类别、描述信息。根据类别使用os.makedirs创建分类目录,对于已存在的分类目录可使用try except进行程序异常处理。最后用PIL库的ImageDraw模块写入识别名称到图片,打开文件并写入识别主体的描述信息。

  3.2 百度AI图像识别、Python网络爬虫等综合应用

  案例6对于前述案例的识别图片都是预先准备好的图片文件。本案例结合Python网络爬虫的功能,程序运行时提示用户输入待爬取图片类别的关键字,系统自动从百度图片网站爬取相关图片并保存在本地硬盘指定文件夹。如爬取关键字为“奥斯卡影星”,程序自动识别影星名字并标注在图片左上角。

  此案例在人工智能图像识别应用中结合了Python爬虫练习,使用到了requests库、urllib库及正则表达式等知识。

  4 总结

  此系列人工智能AI应用案例均为Python语言程序,系列案例的功能是层层递进、前后呼应由易到难。程序的结构也由顺序逐渐加入分支判断及循环遍历。案例中融入了Python常用数据类型及组合数据类型字典、列表的操作。案例设计尽量做到了有趣有用,在激发学习兴趣的同时也提高了学生的编程思维能力和创新能力。

  参考文献

  [1]百度AI接入指南[EB/OL_ttps://ai. baidu .com/ai-doc/REF.ERENCE/Ck3dwjgn3 2021-1-4.关键词:人工智能;百度AI平台; Python程序设计; AI开发能力;案例教学;


返回本篇论文导航
作者单位:河北经贸大学信息技术学院 河北经贸大学管理科学与工程学院
原文出处:马文秀,李焱.基于百度AI的Python程序课程系列案例设计[J].电脑知识与技术,2021,17(19):204-205.
相关内容推荐
相关标签:
返回:软件工程论文