关于python的论文（最新范文6篇）,软件工程论文

　　Python是一门简单,实用而且有趣的百搭款语言,在Web应用开发,系统网络运维,科学与数字计算,网络编程等领域都有所建树.在计算机语言中Python发展速度不可小觑,可以说是最适合零基础人士入门学习的计算机语言之一。本文是搜索整理的关于python的论文6篇，供大家借鉴参考。

　　关于python的论文第一篇：Python在建立住院次均费用报表中的应用

　　摘要：为了解决基于Python建立住院次均费用报表的精细化处理，提高日常统计工作效率，通过介绍Python的功能，展现其在数据核对、数据处理、数据导出中的应用。结果表明，Python可解决住院次均费用导出后需多次整理的问题。由此得出，使用Python分析数据和导出数据，可有效提高统计工作效率。

　　关键词: Python, 住院次均费用:统计报表

　　随着大数据的发展，医院管理层对数据的需求增加，医院统计工作面临新的挑战。统计人员为了能及时完成统计任务，需要增强自身统计业务能力，包括新的数据处理软件的应用，以报表和图表等多种形式从科室、时间、医师等多角度、精细化地展示数据[1]。医院根据三级公立医院绩效考核、DRG点数付费方式改革的要求，制定了本院有关费用指标控制目标。

　　医院费用指标分为门诊费用指标和住院费用指标。统计人员每月在新建Excel中进行汇总计算及调整格式操作，这些传统的数据处理方式存在多次手工操作、效率低下的特点。叶韵韶等人认为无论是直接在Excel中进行汇总计算及调整格式，还是采用统计软件输出粗略的数据再调整格式，无疑都是重复性手工劳动[2]。Python语言作为专业的脚本编辑语言，具有功能强大、操作简单、通用的特点。借助Python语言将计算结果导入预先设计好的报表模板中，极大地提高了工作效率。

　　1. Python介绍

　　Python已经成为最受欢迎的程序设计语言之一。自从2004年以后，Python的使用率呈线性增长。由于Python语言的简洁性、易读性以及可扩展性，在国外用Python做科学计算的研究机构日益增多，一些知名大学已经采用python来教授程序设计课程。Python具有的特点是：易于学习、易于阅读、易于维护、有丰富的标准库、有互动模式支持、可移植、可扩展、提供所有数据库的接口、可嵌入。这使得Python可以应用到软件开发、大数据分析、网络爬虫、机器学习、网站开发等不同领域[3]。

　　2. Python使用步骤

　　本文以住院费用指标为例，介绍Python在医院统计中的运用。主程序依次完成三个功能，分别为：核对病案统计管理系统中出院者的总费用；计算各种费用指标；将计算完成的费用指标导入费用模板。

　　2.1 核对病案统计管理系统中出院者的总费用

　　目前病案统计管理系统是HIS系统的一个子系统，主要包含门诊数据、人力数据、住院病案首页数据、医技数据，其中住院案首页数据的利用最为广泛，如全国三级公立医院绩效考核、医疗质量绩效分析、医保预付费等，病案首页数据从电子病历系统导入，数据分析前的数据质控是必不可少的步骤，这也正好符合了统计法对统计数据准确性的要求。为了确保病案统计管理系统中病案首页总费用的准确性，将该系统中的数据与住院收费系统中出院患者的总费用进行比对。

　　从病案统计管理系统导出某月出院病人总费用，Excel命名为“文件1”，同时导出住院收费系统中同时期出院病人总费用，Excel命名为“文件2”，两个文件同时包含字段：住院号、姓名、出院日期、总费用。以“住院号”+“出院日期”两个指标共同确定病人唯一性，比较同一病人两个系统的总费用差异，若二者差异大于等于1元，则认为该病人费用信息错误，需进入电子病历系统和住院收费系统查询后修正。

　　具体程序如下：

　　2.2 计算各种费用指标

　　在Excel中制作住院次均费用报表模板，表名称为：表*****年**月出院者住院次均费用报表。

　　2.3 将计算完成的费用指标导入费用模板

　　在联众病案统计管理系统中的“查询条件输入”模块中输入“（出院日期大于等于2021年04月01日）并且（出院日期小于等于2021年4月30日）”，“输出项目设置”中选择“病案号、病人序号、科主任、总费用、西药类、中药类、耗材类、手术治疗费、病理诊断费、实验室诊断费、影像学诊断费、住院天数”。将查询结果进行“组合分析”。数据列优先排序字段选择“科主任”，计算列优先排序字段选择“出院人次、总费用、西药类、中药类、耗材类、手术治疗费、检查检验费、平均住院日”。将分析结果另存为Excel文件，取名“****年**月出院者住院次均费用报表-病案统计管理系统导出”。

　　data＿all表格是自己设计的各指标模板，data表格是从病案统计系统导出的各医疗组各项费用指标总和

　　3. 讨论

　　本文介绍了Python在统计报表输出中的应用，给出了多个系统数据的比对和制作出院者住院次均费用报表的程序。

　　随着医保付费方式改革和全国三级公立医院绩效考核的开展，医院数据分析的广度和精度也面临着新的要求。宋慧等人将熟练运用Python作为医院统计人员软件应用能力之一[4]。医院统计人员学会使用先进的数据分析软件，才能保证及时、准确完成大数据时代各种统计任务。仅靠手动多次数据调整和表格制定，已经不能满足现阶段统计工作的需求，并且有些统计指标的计算按照传统的方式已经无法完成，只有将设计思路写入程序中，才能又快又准确地计算出统计指标值。

　　医改新形式势下，随着医院信息化程度的不断提高，医院统计工作对医院统计人员的素质提出了更高的要求[5]。统计人员只有不断改进自己的工作方式，才能满足医院精细化管理需求。

　　参考文献

　　[1]黄跃，魏岚，张董,等.基于大数据的医院信息集成平台建设与应用[J].中国医学装备, 2019,16(4):103-105.

　　[2]叶韵韶,黄雪欢,韩栋.R语言在定制Exce|报表中的应用[J.中国医院统计, 2020.4(27):184-192.

　　[3]王征. python从入门到精通( 1版) [M].北京:中国铁道出版社有限公司, 2020:2-3.

　　[4]宋慧,赵曼,周静,等基于大数据的三级综合医院统计人员能力现状及相关因素分析[J]中国病案, 2021 ,22(4).20-23.

　　[5]史文宗,刘瑞吉,杨奕医改新形势下医院统计工作管理模式的探讨[J].中国医院统计, 2020,27(2):153-160.

　　关于python的论文第二篇：基于Python的人机对话自然语言处理

　　摘要：本文调用了Python功能丰富的第三方库jieba以及TextBlob,利用其强大的函数方法读取了存于Text文档中的科幻文学人机对话以及Siri和Cleverbot的对话文本并进行了分析；随后借助Excel实现了对于量化数据的可视化分析,并结合自然语言处理和语用学理论提出了一种强人工智能的语言模式,最终实现了一次完整的基于Python的自然语言处理,为人工智能中的人机对话领域的研究者提供了一种分析文本的可能思路。

　　关键词: Python3.7; 自然语言处理;可视化分析;人机对话;语用学;

　　1 选题背景与意义

　　十三五期间，我国公布了《新一代人工智能发展规划》，该规划描述了三个主要发展阶段，确定了至2030年使中国成为人工智能世界主要创新中心的目标。

　　实现强人工智能人机对话的关键是理解并处理自然语言，但想要完成这一目标，除了语料数据的支撑，同样需要人工智能拥有情感交流的能力。根据传播学的信息交互理论，人与人之间的内容沟通大约只占20%，而情感沟通要占到80%。因此，如何深层次地理解语境并进行合适的情感交流，是人机对话领域的重点。基于Python的英语自然语言处理已存有较多研究，但语料文本多出于网络[1]，在科幻类文学中的人机对话领域，目前尚无成熟的研究。

　　在此背景下，本文将以文学文本中的人机对话为语料，基于Python的自然语言处理功能来分析文学作品中人机对话，并结合语用学理论，以此来整合出一种强人工智能的语言模式。

　　2 Python自然语言处理需求分析

　　在对于科幻类文学中人机对话进行自然语言处理的过程中含有两个关键步骤，其一是读取文本并进行相关统计，其二是对其内容进行分析。

　　就第一部分而言，考虑到目标是文本分析，因此选择是在自然语言处理领域已经较为成熟的jieba库。基础编程思路是利用jieba库内置的丰富方法，如lcut函数，来进行分词与词频统计等一系列相关处理。在具体读取过程中，可利用Python的列表与字典功能对文本内容进行转存[2]。

　　在进行第二部分时，考虑到Snow NLP和NLTK库并不具备处理大量复杂的英语语言文本的能力，因此本文选择了在英语语言国家更为常见的Text Blob库[3]。统计完成后，本文将在运行结果的基础上对于原始文本的数据进行分析，并基于（转下页）文学文本内容的情感得分和主客观得分定义两项新的评分，即“礼貌值”与“合作值”。

　　3 关键代码说明以及代码测试

　　3.1 所使用第三方库介绍

　　如前所述，本文最重要的环节是文本处理，而在实现需求的过程中将主要调用Python的两个第三方库，分别为jieba库与Text Blob库，本部分将简述这两个库的功能以及在本项目中所起到的具体作用。本部分代码所调用第三方库名称以及应用：

　　(1)jieba库：对原文文本实现分词处理并进行统计词频

　　jieba库是一款优秀的Python第三方分词库，支持三种分词模式，函数简单，容易上手。

　　(2)Text Blob库：统计分析文本内容的情感倾向得分

　　Text Blob是用Python编写的开源文本处理库，可以用来执行很多自然语言处理的任务，比如，短语提取、词汇标注、情感分析、语法分析、情感分析与添加语言新模型，等等[4]。

　　3.2 代码设计

　　本部分将介绍代码的两个主体部分，其功能分别为统计词频和分析文本情感倾向。碍于篇幅所限，本部分只介绍重要代码与编程思想，部分代码将略去不表。

　　下述def代码（1-25行）功能为统计词频，具体实现过程中调用了jieba库[5]，随后简单使用cut方法设置停用词并利用列表功能进行词频统计，本部分代码的输出文件将会是一个存有词频的Text文档。代码26-30行的功能为分析文本内容极性（即情感积极/消极程度）以及文本主客观程度，在代码中分别定义为“Emotion”与“Subjectivity”。此处代码意在简要说明Text Blob库中重要的sentiment方法与polarity方法。

　　4 数据的可视化分析

　　4.1 对于科幻小说中人机对话的分析数据

　　本部分以Python的Text Blob库所得出的源文本情感得分和主客观程度得分为基础，分别对于科幻类文学中的AI、i Phone助手Siri以及人工智能机器人Cleverbot在相同对话中所做出的回答进行了文本分析。为了使得数据更加直观，本部分选取了科幻类文学文本中较有代表性的30个问题，分别令人工智能Siri和Cleverbot进行回答，结合科幻类文学中的人机对话，利用Excel进行数据的可视化分析。

　　分析结果表明，Siri和Cleverbot的情感得分分布围绕着两条基本线：-3.125和0（最大值为10而最小值为-10）。即Siri在面对多个问题时采取了“回避策略”，即对问题表示不知道答案，这也是现有人工智能在人机对话中的常见策略；与之相比，人工智能Cleverbot则试图在回答问题时保持绝对理智，尽量不夹带情感。与之相比，科幻类文学中的AI则尽量与对话人保持相接近的情感倾向。

　　而在主客观程度的得分上可以的出类似的结论，即科幻类文学中的AI尽量与源问题中的主客观程度保持一致，而Siri与Cleverbot的回答得分分布依然围绕着两条基本线：6.875和0（最大值为10而最小值为0）。即Siri的回答更为主观，而Cleverbot则尽量保持绝对客观。这一点其实也与两款人工智能的市场定位有关：Siri的市场定位是“私人办公助手”；而Cleverbot则是用于智能对话的机器人。故此，Siri的回答会基于“为i Phone用户提供个性化的帮助”而变得更加“私人化”，而Cleverbot则采取了“理智回答”方案。

　　4.2 礼貌值与合作值

　　参考前部分的数据分析结果，可得出四项分析内容的平均分：

　　如上表所示，四项内容在情感内容平均分上相差不大，虽然可从主客观得分上判断出Siri和Cleverbot的明显不同，但由于源问题各不相同，很难单一用平均分进行判断。故此，本项目引用自定义的两个评分项，分别为合作值“C”与礼貌值“P”，其定义式如下：

　　其主要数据对比为情感得分与主客观得分的差值，即反应两者之间的极性。礼貌值与合作值的平均分如下：

　　5 人机对话自然语言处理以及语用学分析结果

　　1983年，Leech在《语用学原则》一书中提出了礼貌原则，其中包括两条重要准则，一致原则与同情原则[6]。即减少自己与别人在观点上的不一致[7]。除此之外，格莱斯1975年在“逻辑与会话（Logic and Conversation）”一文中指出了合作原则的原则，其中包括量准则、关联准则以及方式准则，即避免言语晦涩，逻辑要简洁清晰[8]。

　　图1 强人工智能语言模式

　　基于前文分析，可以得出结论，科幻类文学中的“强人工智能”不论是在情感还是主客观程度上都倾向于与对话者保持一致，但现有的人工智能则倾向于在对话中采纳以“回避”为主的消极主观态度(例如Siri)或以“不犯错”为主的中性客观态度(例如Cleverbot)。实际上，人工智能AI的对话原则与语用学的两大原则，即“礼貌原则”与“合作原则”[9,10]，不谋而合，亦即是说，这两条原则可以成为人工智能语言模式中的一部分。具体到人机对话领域中，人工智能应当尽量在对话时与对方在情感与语言极性上保持一致，同时使得自己的话语与对方在逻辑、主客观程度和信息量上达到态度一致，图1。

　　6 结论

　　本文调用了Python的jieba库词频统计、Text Blob库情感分析以及re库Python办公自动化等多种功能，实现了一次完整的基于Python的自然语言处理，为人工智能中人机对话领域的研究者提供了一种分析文本的可能思路。但文章中尚存有不少课继续探究之处。首先，自然语言处理并非只能局限于Python，目前这一领域的研究已经较为成熟，在经过外文文献阅读后可以得到更多的研究视角；其次，Text Blob库以及Snow NLP库只是Python强大第三方库中的冰山一角，倘若对于Python加以更富有创造性的使用，势必可以获得更加客观且更富有统计学意义的分析结果，而更加前沿的研究，则需要未来更加深入且不间断地探索与思考。

　　参考文献

　　[1]Rafeeque Pandarachalil, Selvaraju Sendhilkumar,G SMahalakshmi.Twitter Sentiment Analysis for Large-Scale Data An Unsupervised Approach[J]. Cognitive Computation,2015,7254-262.

　　[2]涂小琴基于Python爬虫的电影评论情感倾向性分析[J]现代计算机,2017,35:53-55.

　　[3]Farha Nausheen, Sayyada Hajera Begum. Sentiment Analysis to Predict Election Results[A].Proc eedings of the Second International Conference on Inventive Systems and Control[C]1st ed,Kwangsu Lee ,Cham:Springer Nature Switzerland AG2019, 1259-1262.

　　[4] Python文本情感分析[EB/OLhttps://www. janshu. com/p/b775f978b004,2019.

　　[5]成文莹,李秀敏基于Python的电影数据爬取与数据可视化分析研究[J]数据库与信息管理,2019,31:8-10.

　　[6]Michelle Z.Rosaldo.The Things We Do with Words.llongot Speech Acts and Speech Act Theory in Philosophy[J].Language in Society, 1982,(11)2:203-237.

　　[7]Pintip Hompluem Dunn.How Judges overrule:Speech Act Theory and the Doctrine of Stare Decisis[J].Yale Law Journal2003,113.493-51.

　　[8]Kent Bach.The Myth of Conventional Implic ature[J]L inguistics and Philosopl,.999.22,327-366.

　　[9]Bethan L Davies. Grice's Cooperative Principle:Meaning and rationality[J].Journal of Pragmatic s,2007.(39)12:2308-2331.

　　[10]张晓丽.王券斐.《从合作原则浅析小说《傲慢与偏见》中的人物对话》[J] 外国文学,2014,8:319.

返回本篇论文导航