济南天桥区Python培训哪家专业
IT培训、Python、后端开发培训班
Python全栈/人工智能 八个授课阶段 水平一见高下
第1阶段
Python入门
基本语法
1.Python变量;2.Python的数据类型;3.Python中的运算符;4.流程控制;5.猜数字;6.猜数字改进;7.斐波那契数列、汉诺塔
字符串解析
1.字符串;2.原始字符串;3.长字符串;4.字符串内置方法;5.字符串格式化
时间日历
1.时间和日期;2.获取格式化时间 ;3.获取日历;4.Time模块;5.时间格式;6.日历模块
文件操作
1.在线文件管理系统;2.自定义递归统计目录函数;3.自定义递归赋值目录函数;4.自定义目录复制函数;5.自定义文件复制函数;6.优化在线文件管理系统
Python模块
1.模块概念;2.模块 函数 对象都是将程3.序分成较小的部分;4.模块就是可用代码打包;5.模块就是更*的封装;6.模块作用;7.模块用法;8.命名空间;9.导入模块;10.包异常处理
1.什么是异常;2.检测异常;3.处理异常;4.异常传递;5.自定义抛异常;6.With语句
实战项:Python及PyGame **开发
打飞机小游戏
1.游戏界面开发;2.检测键盘;3.操控飞机;4.射击子弹;5.敌机移动;6.射击积分;7.判断胜负
汉诺塔
Tkinter实现简易计算器
第二阶段
编程思想-算法、面向对象
数据结构及算法
1. 数组、链表、栈、队列、树、图2. 冒泡、二叉树、哈希、拆半等各种常见排序和查找算法学习
面向对象
1.面向对象思想;2.对象是一种封装的思想;3.数据和方法都封装在一起;4.类和对象;5.Self关键词;6.Python魔术方法;7.多态;8.类属性和实例属性;9.静态方法和类方法; 10.类的继承;11.继承的作用,不要每次都重新定义;12.让相似的东西自动传递就是继承;13.类继承的应用
设计模式
1.工厂模式;2.单例模式
第三阶段
Python全栈
HTML5 CSS3
1.一个简单的页面;2.表格制作个人简历;3.音、视频页面;4.用户信息录入验证;5.网站首页;6.网页导航栏制作;7.使用表单制作注册页面;8.常见过滤、动画**;9.页面布局;10.两栏、三栏页面;11.门户网站首页制作
JavaScript
1.JavaScript简介;2.在页面中使用JavaScript;3.JavaScript的语法;4.JS的DOM操作;5.JS的BOM操作;6.AJAX
JQuery
1.JQuery简介;2.JQuery安装;3.JQuery CSS操作;4.JQuery选择器;5.JQuery筛选;6.JQuery HTML文档处理;7.JQuery事件;8.JQuery效果;9.JQuery Ajax;10.JQuery其他操作;11.JQuery插件
项目
1.PS切图;2.CSS重置样式表;3.网页规范;4.兼容性;5.SASS;6.Compass精灵图;7.代码压缩;8.常见网站效果;9.rem相对大小布局
JavaScript单页应用技术开发实战
1.Bootstrap前端开发框架;2.Bootstrap前端开发框架
Django框架开发
1.Django框架发展;2.Django架构、MTV模式;3.开发流程;4.开发实例
RESTful接口开发
IT培训 后端开发 PHP等 Python培训班 H5 Web
1.RESTful API是什么;2.如何设计好用的API;3.**;4.域名;5.版本;6.路径;7.HTTP动词;8.过滤信息;9.状态码;10.错误处理;11.返回结果;12.Hypermedia API;13.身份认证;14.数据格式
微信公众号开发
1.微平台简介;2.微信服务号的申请与使用;3.接入方式简介;4.微信公众号数据格式简介;5.公众号接口数据解析和常用的令数据获取;6.信息教研原理 7.接收和发送文本数据包;8.接收和发送图片数据包;9.接收和发送新闻数据包;10.自定义菜单;11.微信支付接口接入与开发
MySQL数据库设计
1.数据库管理;2.MySQL数据库中数据表的设计;3.SQL语言设计
第四阶段
现代软件开发方法
Git项目代码管理和项目开发流程
1.MarkDown文档编写;
2.Git分布式版本控制器
python作为一种具有相对简单语法的*解释语言,即使对于那些没有编程经验的人来说,Python也是简单易操作的。强大的Python库让你事半功倍。在处理文本信息时,通常我们需要从word、PDF文档中提取出信息,而PDF是重要和广泛使用的用来呈现和交换文件的数字媒体*一
。PDF包含有用的信息,链接和按钮,表单域,音频,视频和业务逻辑。python库很好地集成并提供处理非结构化数据源。运用python可以轻松从PDF中提取有用信息后,您可以轻松地将该数据用于任何机器学习或自然语言处理模型。
常见的Python库
以下是可用于处理PDF文件的一些Python库
PDFMiner :一个从PDF文档中提取信息的工具。与其他PDF相关工具不同,它完全专注于获取和分析文本数据。
PyPDF2 :一个纯python PDF库,能够分割,合并,裁剪和转换PDF文件的页面。它还可以向PDF文件添加自定义数据,查看选项和密码。它可以从PDF中检索文本和元数据,以及将整个文件合并在一起。
Tabula-py:一个 tabula-java的简单Python包装器,它可以读取PDF表。您可以从PDF读取表格并转换为pandas的DataFrame。tabula-py还允许您将PDF文件转换为CSV / TSV / JSON文件。
Slate:PDFMiner的包装器实现
PDFQuery:pdfminer,lxml和pyquery的轻量级包装器。它旨在使用尽可能少的代码可靠地从PDF集合中提取数据。
xpdf :xpdf的 Python包装器(目前只是“pdftotext”实用程序)
从pdf中提取文本
使用PyPDF2从pdf中提取简单文本,示例代码如下:
import PyPDF2 # pdf file object # you can find find the pdf file with **plete code in belowpdf FileObj = open('example.pdf', 'rb') # pdf reader objectpdfReader = PyPDF2.Pdf FileReader(pdfFileObj )# number of pages in pdfprint(pdfReader.numPages) # a page objectpageObj = pdfReader.getPage(0) # extracting text from page. # this will print the text you can also save that into String print(pageObj.extractText())
从pdf中读取表格数据
使用Pdf中的Table数据,我们可以使用Tabula-py,示例代码如下:
import tabula # readinf the PDF file that contain Table Data # you can find find the pdf file with **plete code in below # read_pdf will save the pdf table into Pandas Dataframe df = tabula.read_pdf("offense.pdf") # in order to print first 5 lines of Table df.head()
如果您的Pdf文件包含多个表,可以进行如下设置:
df = tabula.read_pdf(“crime.pdf”,multiple_tables = True)
还可以从任何特定PDF页面的特定部分提取信息
tabula.read_pdf(“crime.pdf”,area =(126,149,212,462),pages = 1)
设置读取输出为JSON格式
tabula.read_pdf(“crime.pdf”,output_format =“json”)
将Pdf导出到Excel
使用以下代码将PDF数据转换为Excel或CSV
tabula.convert_into(“crime.pdf”,“crime_testing.xlsx”,output_format =“xlsx”)
更多培训课程,学习资讯,课程优惠等学校信息,请进入 济南天桥区Web培训济南历城区Python培训济南长清区Linux云计算培训 网站详细了解,免费咨询电话:400-998-6158