情景介绍
平时工作中,我习惯使用rz从本地上传文件到服务器,sz从服务器下载文件到本地,但对传输文件大小有限制,例如排查线上jvm的问题,需要生成了dump文件,可能有10G大,超过了限制,怎么下载呢?
拆分文件命令之split
语法
split怎么用Python,split [-<行数>][-l<行数>][-b<字节>][-C<字节>][要切割的文件][输出文件名的前缀][-a<后缀长度>]
- 或-l :指定每多少行切成一个小文件 行数> 行数>
-b :指定每多少字节切成一个小文件,这里也可以指定K、M、G等单位 字节>
-C :与-b 类似,但在切割时会尽量维持每行的完整性 字节> 字节>
输出文件名的前缀:设置拆分后文件的名称前缀,split会自动在前缀后面加上编号,默认从aa开始
split() 方法语法:str.split(str="", num=string.count(str))三、参数 str -- 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。num -- 分割次数。默认为 -1, 即分隔所有。四、返回值 返回。
-a :默认后缀长度是2,即按 aa,ab,ac的顺序排序 后缀长度>
split命令和cat命令可以完成上面的难题,排查线上问题的现场已经没有了,所以为了演示,用dd命令(对dd命令不了解的也可以学下,因为这次重点介绍split,所以dd暂且不介绍)创建一个400MB的文件,文件名是adsearch.hprof,这里假设400MB的大小就超过了服务器的下载限制
Java中的 split 函数是用于按指定字符(串)或正则去分割某个字符串,结果以字符串数组形式返回;java] view plain copy tring str="1234@abc";String[] a = str.split("@");System.out.println("处理结果: "+a[。
dd if=/dev/zero bs=1024 count=409600 of=adsearch.hprof
Dim TestArray() As String = Split(TestString)下面的示例演示如何拆分一行中有多个分隔符的字符串,以及如何筛选掉空字符串。DimTestStringAsString="applepearbanana"DimTestArray()AsString=Split(TestString)'TestArrayhol。
如图所示,创建了一个400MB的文件
那我把adsearch.hprof文件按100MB大小拆分,可以拆分成4个文件
split -b 100M adsearch.hprof
可以看到在执行完split命令后,目录下生成了四个相同大小 xaa、xab、xac、xad四个100MB的小文件。因为我们没有指定前缀,就采用了默认的前缀x,后面跟着aa、ab、ac、ad。我们也可以指定前缀,比如我把刚刚生成的四个小文件删掉,用下面的命令重新切分下
split -b 100M adsearch.hprof adsearch-
合并文件之cat
把大文件切分后,我们就可以把小文件下载到本地,然后把他们再拼接起来
一、 用作动词(v.)二、用作不及物动词 S+~(+A)The wood splits easily.这木头容易劈开。Good mushrooms easily split from end to end.好的蘑菇容易地从这端到那端裂开来。My head feels as though it will spl。
/ 用通配符的形式,要保证该目录下没有其他以adsearch-a为前缀的文件
cat adsearch-a* > adsearch.hprof
/ 或者指定文件进行拼接
备注
上面的操作我是在win本上的gitbash操作的,有cat命令
那如果没有安装gitbash只有cmd呢?
可以使用copy /b 命令来拼接,其中 /b 代表指定以二进制格式进行复制
copy /b adsearch-aa + adsearch-ab + adsearch-ac + adsearch-ad adsearch.hprof
校验
原始文件的md5
合并后文件的md5(gitbash)
合并后文件的md5(cmd)
经过对前后文件的md5值比价,结果一致,说明我们的操作没有问题
小结
当我们下载或上传相对较大的文件时,可以使用split把大文件拆分成小文件,然后用cat命令把这些小文件重新拼接成大文件