首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
推荐学习书目
?
Learn Python the Hard Way
Python Sites
?
PyPI
- Python Package Index
?
http://diveintopython.org/toc/index.html
?
Pocoo
值得关注的项目
?
PyPy
?
Celery
?
Jinja2
?
Read the Docs
?
gevent
?
pyenv
?
virtualenv
?
Stackless Python
?
Beautiful Soup
?
结巴中文分词
?
Green Unicorn
?
Sentry
?
Shovel
?
Pyflakes
?
pytest
Python 编程
?
pep8 Checker
Styles
?
PEP 8
?
Google Python Style Guide
?
Code Style from The Hitchhiker's Guide
V2EX
?
Python
求助一个新手问题。
clintme
·
13 天前
· 768 次点击
(
腾讯云最新优惠活动来了:云产品限时1折,云服务器低至88元/年 ,
点击这里立即抢购:9i0i.cn/qcloud
,更有2860元代金券免费领取,付款直接抵现金用,
点击这里立即领取:9i0i.cn/qcloudquan
)
(福利推荐:
你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun
)
用 python PyPDF2 组件读取 pdf 文件,如何区分出真实的段落和每一行的分割呢,都是用\n 表示的,全部替换的话就失去段落了。
2 条回复
?
2024-04-20 09:18:46 +08:00
1
caomu
13 天前 via Android
参考一下这些的实现
https://github.com/songquanpeng/text-formatter
https://github.com/CopyPlusPlus/CopyPlusPlus
2
clintme
OP
13 天前
用正则搞定了,感谢
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
我们的愿景
·
实用小工具
·
2163 人在线
最高记录 6543
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms ·
UTC 10:39
·
PVG 18:39
·
LAX 03:39
·
JFK 06:39
Developed with
CodeLauncher
? Do have faith in what you're doing.
http://www.vxiaotou.com