Home
Sign Up
Sign In
V2EX
›
问与答
Linux 如何处理超大体积的文本文件?
Ryans
·
Jul 5, 2015
· 2529 views
This topic created in 3990 days ago, the information mentioned may be changed or developed.
例如,以 GB 为单位的文本文件,内容为纪录条目
1)对文件里面的条目去重,仅保留不重复的内容
2)切割文件,例如只保留最后 1/3 或 最后 1/2 体积的内容
使用uniq sort 等系统自带命令
条目
文本文件
体积
2 replies
•
2015-07-06 11:50:34 +08:00
1
msg7086
Jul 6, 2015
切割可以 head / tail。
去重需要 sort + uniq 要看内存有多大了吧。
2
tanywei
Jul 6, 2015
python yield
About
·
Help
·
Advertise
·
Blog
·
API
·
FAQ
·
Solana
·
3325 Online
Highest 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms ·
UTC 10:58
·
PVG 18:58
·
LAX 03:58
·
JFK 06:58
♥ Do have faith in what you're doing.
❯