3.2.2 for循环语句

2022-04-13 15:07 更新

(三) 定点提取:tokens=

  上一节在讲解 delims= 的时候,我一再强调 for /f 默认只能提取到第一节的内容,现在我们来思考一个问题
:如果我要提取的内容不在第一节上,那怎么办?

  这回,就该轮到 tokens= 出马了。

  tokens= 后面一般跟的是数字,如 tokens=2,也可以跟多个,但是每个数字之间用逗号分隔,如 tokens=3,5,8
,它们的含义分别是:提取第2节字符串、提取第3、第5和第8节字符串。注意,这里所说的“节”,是由 delims=
这一开关划分的,它的内容并不是一成不变的。

  下面来看一个例子:
[txt2]

尺有所短,寸有所长,学好批处理没商量,考虑问题复杂化,解决问题简洁化。  

对[txt2]这段文本,假设它们保存在文件test.txt中,如果我想提取“学好批处理没商量”这句话,该如何写代码呢

  我们稍微观察一下[txt2]就会发现,如果以逗号作为切分符号,就正好可以把“学好批处理没商量”化为单独的
一“节”,结合上一节的讲解,我们知道,"delims=," 这个开关是不可缺少的,而要提取的内容在以逗号切分的第
3节上,那么,tokens= 后面的数字就应该是3了,最终的代码如下:
[code8]

@echo off
for /f "delims=, tokens=3" %%i in (test.txt) do echo %%i
pause  

如果我们现在要提取的不只一个“节”,而是多个,那又怎么办呢?比如,要提取以逗号切分的第2节和第5节字符串
,是写成这样吗?
[code9]

@echo off
for /f "delims=, tokens=2,5" %%i in (test.txt) do echo %%i
pause  

运行批处理后发现,执行结果只显示了第2节的内容。

  原来,echo 后面的 %%i 只接收到了 tokens=2,5 中第一个数值2所代表的那个字符串,而第二个数值5所代表的
字符串因为没有变量来接收,所以就无法在执行结果中显示出来了。

  那么,要如何接收 tokens= 后面多个数值所指代的内容呢?

  for /f 语句对这种情况做如下规定:

  如果 tokens= 后面指定了多个数字,如果形式变量为%%i,那么,第一个数字指代的内容用第一个形式变量%%i
来接收,第二个数字指代的内容用第二个形式变量%%j来接收,第三个数字指代的内容用第三个形式变量%%k来接收…
…第N个数字指代的内容用第N个形式变量来接收,其中,形式变量遵循字母的排序,第N个形式变量具体是什么符号
,由第一个形式变量来决定:如果第一个形式变量是%%i,那么,第二个形式变量就是%%j;如果第一个形式变量用的
是%%x,那么,第二个形式变量就是%%y。

  现在回头去看[code9],你应该知道如何修改才能满足题目的要求了吧?修改结果如下:
[code10]

@echo off
for /f "delims=, tokens=2,5" %%i in (test.txt) do echo %%i %%j
pause  

如果有这样一个要求:显示[txt2]中的内容,但是逗号要替换成空格,如何编写代码?

  结合上面所学的内容,稍加思索,你可能很快就得出了答案:
[code11]

@echo off
for /f "delims=, tokens=1,2,3,4,5" %%i in (test.txt) do echo %%i %%j %%k %%l %%m
pause  

写完之后,你可能意识到这样一个问题:假如要提取的“节”数不是5,而是10,或者20,或者更多,难道我也得从1
写到10、20或者更多吗?有没有更简洁的写法呢?

  答案是有的,那就是:如果要提取的内容是连续的多“节”的话,那么,连续的数字可以只写最小值和最大值,
中间用短横连接起来即可,比如 tokens=1,2,3,4,5 可以简写为 tokens=1-5 。

  还可以把这个表达式写得更复杂一点:tokens=1,2-5,tokens=1-3,4,5,tokens=1-4,5……怎么方便就怎么写吧

  大家可能还看到一种比较怪异的写法:
[code12]
 
for /f "delims=, tokens=1,*" %%i in (test.txt) do echo %%i %%j
pause  

结果,第一个逗号不见了,取代它的是一个空格符号,其余部分保持不变。

  其中奥妙就在这个星号上面。

  tokens=后面所接的星号具备这样的功能:字符串从左往右被切分成紧跟在*之前的数值所表示的节数之后,字符
串的其余部分保持不变,整体被*所表示的一个变量接收。

  理论讲解是比较枯燥的,特别是为了严密起见,还使用了很多限定性的修饰词,导致句子很长,增加了理解的难
度,我们还是结合[code12]来讲解一下吧。

  [txt2] 的内容被切分,切分符号为逗号,当切分完第一节之后,切分动作不再继续下去,因为 tokens=1,* 中
,星号前面紧跟的是数字1;第一节字符串被切分完之后,其余部分字符串不做任何切分,整体作为第二节字符串,
这样,[txt2]就被切分成了两节,分别被变量%%i和变量%%j接收。

  以上几种切分方式可以结合在一起使用。不知道下面这段代码的含义你是否看得懂,如果看不懂的话,那就运行
一下代码,然后反复揣摩,你一定会更加深刻地理解本节所讲解的内容的:
[code13]
 
@echo off
for /f "delims=, tokens=1,3-4,*" %%i in (test.txt) do echo %%i %%j %%k %%l
pause    
-----------------------------------------------------------------------------------------------------


(四) 跳过无关内容,直奔主题:skip=n

  很多时候,有用的信息并不是贯穿文本内容的始终,而是位于第N行之后的行内,为了提高文本处理的效率,或
者不受多余信息的干扰,for /f 允许你跳过这些无用的行,直接从第N 1行开始处理,这个时候,就需要使用参数
 skip=n,其中,n是一个正整数,表示要跳过的行数。例如:
[code14]
 
@echo off
for /f "skip=2" %%i in (test.txt) do echo %%i
pause  

这段代码将跳过头两行内容,从第3行起显示test.txt中的信息。
-----------------------------------------------------------------------------------------------------


(五) 忽略以指定字符打头的行:eol=

  在cmd窗口中敲入:for /?,相关的解释为:
引用:
eol=c           - 指一个行注释字符的结尾(就一个)引用:
FOR /F "eol=; tokens=2,3* delims=, " %i in (myfile.txt) do @echo %i %j %k
    会分析 myfile.txt 中的每一行,忽略以分号打头的那些行……  第一条解释狗屁不通,颇为费解:行注释字
符的结尾是什么意思?“(就一个)”怎么回事?结合第二条解释,才知道eol有忽略指定行的功能。但是,这两条解
释是互相矛盾的:到底是忽略以指定字符打头的行,还是忽略以指定字符结尾的行?

  实践是检验真理的唯一标准,还是用代码来检验一下eol的作用吧:
[code15]
 
@echo off
for /f "eol=;" %%i in (test.txt) do echo %%i
pause  

结果,那些以分号打头的行没有显示出来。

  由此可见,第二条解释是正确的,eol= 的准确含义是:忽略以指定字符打头的行。而第一条的“结尾”纯属微
软在信口开河。

  那么,“(就一个)”又作何解释呢?

  试试这个代码:
[code16]
 
@echo off
for /f "eol=,;" %%i in (test.txt) do echo %%i
pause  

此时,屏幕上出现 此时不应有 ;"。 的报错信息。可见,在指定字符的时候,只能指定1个——在很多时候,我对这
样的设计颇有微词而又无可奈何:为什么只能指定1个而不是多个?要忽略多个还得又是if又是findstr加管道来多次
过滤,那效率实在太低下了——能用到的功能基本上都提供,但是却又做不到更好,批处理,你的功能为什么那么弱?

  不知道大家注意到没有,如果test.txt中有以分号打头的行,那么,这些行在代码[code14]的执行结果中将凭空
消失。

  原来,for /f 语句是默认忽略以分号打头的行内容的,正如它默认以空格键或跳格键作为字符串的切分字符一样。

  很多时候,我们可以充分利用这个特点,比如,在设计即将用for读取的配置文件的时候,可以在注释文字的行
首加上分号,例如在编写病毒文件查杀代码的时候,可以通过for语句来读取病毒文件列表,那么,病毒文件列表.ini
这个配置文件可以这样写:
 
;以下是常见的病毒文件,请见一个杀一个^_^
;copyleft:没有
qq.exe
msn.exe
iexplore.exe  

如果要取消这个默认设置,可选择的办法是:

  1、为eol=指定另外一个字符;
  2、使用 for /f "eol=" 语句,也就是说,强制指定字符为空,就像对付delims=一样。
-----------------------------------------------------------------------------------------------------


(六)如何决定该使用 for /f 的哪种句式?(兼谈usebackq的使用)

  for /f %%i in (……) do (……) 语句有好几种变形语句,不同之处在于第一个括号里的内容:有的是用单引
号括起来,有的是用双引号包住,有的不用任何符号包裹,具体格式为:
引用:
  1、for /f %%i in (文件名) do (……)
  2、for /f %%i in ('命令语句') do (……)
3、for /f %%i in ("字符串") do (……)  

看到这里,我想很多人可能已经开始犯了迷糊了:如果要解决一个具体问题,面对这么多的选择,如何决定该使用哪
一条呢?

  实际上,当我在上面罗列这些语句的时候,已经有所提示了,不知道你是否注意到了。

  如果你一时无法参透其中奥妙,那也无妨,请听我一一道来便是。

  1、当你希望读取文本文件中的内容的话,第一个括号中不用任何符号包裹,应该使用的是第1条语句;例如:你
想显示test.txt中的内容,那么,就使用 for /f %%i in (test.txt) do echo %%i;
  2、当你读取的是命令语句执行结果中的内容的话,第一个括号中的命令语句必须使用单引号包裹,应该使用的是
第2条语句;例如:你想显示当前目录下文件名中含有test字符串的文本文件的时候,应该使用
 for /f %%i in ('dir /a-d /b *test*.txt') do echo %%i 这样的语句;
  3、当你要处理的是一个字符串的时候,第一个括号中的内容必须用双引号括起来,应该是用的是第3条语句;例
如:当你想把bbs.bathome.cn这串字符中的点号换为短横线并显示出来的话,可以使用
for /f "delims=. tokens=1-3" %%i in ("bbs.bathome.cn") do echo %%i-%%j-%%k 这样的语句。

  很显然,第一个括号里是否需要用符号包裹起来,以及使用什么样的符号包裹,取决于要处理的对象属于什么类
型:如果是文件,则无需包裹;如果是命令语句,则用单引号包裹;如果是字符串,则使用双引号括起来。

  当然,事情并不是绝对如此,如果细心的你想到了批处理中难缠的特殊字符,你肯定会头大如斗。

  或许你头脑中灵光一闪,已经想到了一个十分头痛的问题:在第1条语句中,如果文件名中含有空格或&,该怎么
办?

  照旧吗?

  拿个叫 test 1.txt 的文件来试试。

  你很快写好了代码,新建文件-->码字-->保存为批处理,前后费时不到1分钟:
[code17]
 
 @echo off
for /f %%i in (test 1.txt) do echo %%i
pause 

你兴冲冲地双击批处理,运行后,屏幕上出现了可耻的报错信息:系统找不到文件 test 。

  当你把 test 1.txt 换成 test&1.txt 后,更怪异的事情发生了:CMD窗口在你眼前一闪而过,然后,优雅地
消失了。

  你可能觉得自己的代码写错了某些符号,你再仔细的检查了一次,确认没有笔误,然后,你再次双击批处理,
结果问题照旧;你开始怀疑其他程序对它可能有影响,于是关掉其他窗口,再运行了一次,问题依旧;你不服气
地连续运行了好几次,还是同样的结果。

  怪哉!

  你一拍大腿,猛然想起了一件事:当路径中含有特殊字符的时候,应该使用引号把路径括起来。对,就是它了!

  但是,当你把代码写出来之后,你很快就焉了:for /f %%i in ("test 1.txt") do echo %%i,这不就是上面
提到的第3条 for /f 命令的格式吗?批处理会把 test 1.txt 这个文件名识别为字符串啊!

  你百无聊赖地在CMD窗口中输入 for /? ,并重重地敲下了回车,漫无目的地在帮助信息中寻找,希望能找到点
什么。

  结果还真让你到了点什么。

  你看到了这样的描述:
引用:
        usebackq        - 指定新语法已在下类情况中使用:
                          在作为命令执行一个后引号的字符串并且一个单
                          引号字符为文字字符串命令并允许在 filenameset
                          中使用双引号扩起文件名称。  但是,通读一遍之后,你却如坠五里雾中,不知所
云。

  还好,下面有个例子,并配有简单的说明:
引用:

      FOR /F "usebackq delims==" %i IN (`set`) DO @echo %i
    会枚举当前环境中的环境变量名称。  你仔细对比了for /f语句使用usebackq和不使用usebackq时在写法上
的差别,很快就找到了答案:当使用了usebackq之后,如果第一个括号中是一条命令语句,那么,就要把单引号'改
成后引号`(键盘左上角esc键下面的那个按键,与~在同一键位上)。

  回过头去再看那段关于usebackq的描述,字斟句酌,反复揣摩,终于被你破译了天机:usebackq 是一个增强
型参数,当使用了这个参数之后,原来的for语句中第一个括号内的写法要做如下变动:如果第一个括号里的对象
是一条命令语句的话,原来的单引号'要改为后引号`;如果第一个括号里的对象是字符串的话,原来的双引号"要
改为单引号';如果第一个括号里的对象是文件名的话,要用双引号"括起来。

  验证一下,把[code17]改写成如下代码:
[code18]
 
@echo off
for /f "usebackq" %%i in ("test 1.txt") do echo %%i
pause  

测试通过!

  此时,你很可能会仰天长叹:Shit,微软这该死的机器翻译!

  至于把[code17]代码中的空格换成&后,CMD窗口会直接退出,那是因为&是复合语句的连接符,CMD在预处理的
时候,会优先把&前后两部分作为两条语句来解析,而不是大家想象中的一条完整的for语句,从而产生了严重的语
法错误。因为牵涉到预处理机制问题,不属于本节要讨论的内容,在此不做详细讲解。

  这个时候,我们会吃惊地发现,区区一条for语句,竟然有多达6种句型:
 
  1、for /f %%i in (文件名) do (……)
  2、for /f %%i in ('命令语句') do (……)
  3、for /f %%i in ("字符串") do (……)
  4、for /f "usebackq" %%i in ("文件名") do (……)
  5、for /f "usebackq" %%i in (`命令语句`) do (……)
6、for /f "usebackq" %%i in ('字符串') do (……)  

其中,4、5、6由1、2、3发展而来,他们有这样的对应关系:1-->4、2-->5、3-->6。

  好在后3种情形并不常用,所以,牢牢掌握好前三种句型的适用情形就可以了,否则,要在这么多句型中确定
选择哪一条语句来使用,还真有点让人头脑发懵。

至于 for /f 为什么要增加usebacq参数,我只为第4条语句找到了合理的解释:为了兼容文件名中所带的空格或&。
它在第5、6条语句中为什么还有存在的必要,我也不是很明白,这有待于各位去慢慢发现。 


以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号