Featured image of post 命令行参数

命令行参数

使用Go处理命令行参数相关的操作

大部分程序处理输入然后从产生输出,这就是关于计算的大致定义。但是程序怎样获取数据的输入呢?一些程序自己生成数据,更多的时候,输入来自一个外部源:文件、网络连接、其他程序的输出、键盘、命令行参数等。随后的一些样例将从命令行参数开始讨论这些输入。

os包提供一些函数和变量,以与平台无关的方式和操作系统打交道。命令行参数以os包中的Args名字的变量供程序访问,在os包外面,使用os.Args这个名字。

变量os.Args是一个字符串slicesliceGo中的基础概念,很快会在接下来的教程中讨论到它。现在只需要理解它是一个动态容量的顺序数组s即可,可以通过s[i]来访问的单个元素,通过s[m:n]来访问一段连续子区间,数组用len(s)表示。与大部分编程语言一样,在Go中,所有的索引使用半开区间,即包含第一个索引,不包含最后一个索引,因为这样逻辑比较简单。例如Slice s[m:n],其中,$0\leq m\leq n\leq len(s)$,包含n-m个元素。

os.Args的第一个元素是os.Args[0],它是命令本身的名字;另外的元素是程序开始执行时的参数。表达式s[m:n]表示一个从第m个到第n-1个元素的slice,所以下一个示例中slice需要的元素是os.Args[1:len(os.Args)]。如果mn缺失,默认分别是0len(s),所以我们可以将期望的slice简写为os.Args[1:]

这里有一个UNIX echo命令的实现,它将命令行参数输出到一行。该实现需要导入两个包,使用由圆括号括起来的列表,而不是独立的import声明。两者都是合法的,但为了方便起见,我们使用列表的方式。导入的顺序是没有关系的,gofmt工具会将其按照字母顺序表进行排序。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
// echo 输出其命令行参数
package main

import (
	"fmt"
	"os"
)

func main() {
	var s, sep string
	for i := 1; i < len(os.Args); i++ {
		s += sep + os.Args[i]
		sep = " "
	}
	fmt.Println(s)
}

在代码第一行中使用了注释,注释以//开头。所有以//开头的文本是给程序员看的注释,编译器将会忽略它们。在一个包声明前,我们通常会使用注释对其进行描述;

var关键字声明了两个string类型的变量ssep。变量可以在声明的时候初始化。如果变量没有明确地初始化,它将隐式地初始化为这个类型地空值。例如,对于数字初始化的结果是0,对于字符串是空字符串""。在这个示例中,ssep隐式初始化为空字符串。

对于数字,Go提供常规的算术和逻辑操作符。当应用于字符串时,+操作符对字符串的值进行追加操作,所以表达式

1
sep + os.Args[i]

表示将sepos.Args[i]追加到一起。程序中使用的语句

1
s += sep + os.Args[i]

是一个赋值语句,将sepos.Args[i]追加到旧的s上面,并且重新赋值给s,它等价于下面的语句:

1
s = s + sep + os.Args[i]

操作符+=是一个赋值运算符。每一个算数和逻辑操作符(例如+或者*)都有一个对齐的赋值操作符。

echo程序会循环每次输出,这个程序通过反复追加来构建一个字符串。字符串s一开始为空字符串"",每一次循环追加一些文本。在第一次迭代后,一个空格被插入,这样当循环结束时,每个参数之间都有一个空格。这是一个二次过程,如果参数数量很大成本会比较高,不过对于这个程序还好,之后的教程中会介绍几个改进版本。

循环的索引变量ifor循环开始处声明。:=符号用于短变量声明,这种语句声明一个或多个变量,并且根据初始化的值给予合适的类型,会在之后的教程中讨论到它。

递增语句i++i进行加1,它等价于i += 1,又等价于i = i +1。对应的递减语句i--i进行减1.这些是语句,而不像其他C族语言中一样是表达式,所以j = i++Go语言中是不合法的,并且在Go中仅支持后缀,所以--i也不合法。

forGo里面的唯一循环语句。它有几种形式,这里展示其中一种,其他几种会在之后的教程中详细介绍。

1
2
3
for initialization; condition; post {
    // 循环体:包含零个或多个语句
}

for循环的三个组成部分两边不用小括号(与C族语言,java进行区分)。大括号是必须的,但左大括号必须和post(后置)语句在同一行。

可选的initialization(初始化)语句在循环开始之前执行。如果存在,它必须是一个简单的语句,比如一个简短的变量声明,一个递增或赋值语句,或者一个函数调用。condition(条件)是一个布尔表达式,在循环的每一次迭代开始前推演,如果推演结果是真,循环则继续执行。post语句在循环体之后被执行,然后条件被再次推演,直到条件变成假之后循环才介绍。

其实三部分都是可以省略的,如果没有initializationpost语句,分号可以省略:

1
2
3
4
// C++中传统的"while"循环
for condition{
	// ...
}

如果条件部分都不存在,例子如下:

1
2
3
4
// C++中传统的无限循环
for {
	// ...
}

循环时无限的,但是这种形式的循环可以在循环体里面加上break或者return等语句进行终止。

另一种形式的for循环在字符串或者slice数据上迭代,例如上面的echo程序可以改为:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
// echo 输出其命令行参数
package main

import (
	"fmt"
	"os"
)

func main() {
    s, sep := "", ""
	for _, arg := range os.Args[1:] {
		s += sep + arg
		sep = " "
	}
	fmt.Println(s)
}

每一次迭代,range都会产生一对值:所以和这个索引处的元素值。这个例子里,因为不需要索引,但是在语法上range循环需要处理,因此页必须处理所有。一个方法时我们将所有赋予一个临时变量(如temp)然后忽略它,但是,但是!在Go中不允许存在无用的临时变量,不然会出现错误。

Go中的解决方案时使用空标识符,它的名字是_(即下划线)。空标识符可以用在任何语法需要变量名但是程序逻辑不需要的地方,例如丢弃每次迭代产生的无用的所以。大多数Go程序员喜欢搭配使用range_来写上面的echo程序,因为所有在os.Args上面是隐式的,所以更不容易犯错。

同时,在这个改进的echo程序中使用了短的变量声明来声明和初始化ssep(代码第11行),但是我们可以等价地分开声明变量。以下几种声明字符串变量地方式是等价的:

1
2
3
4
s := ""
var s string
var s = ""
var s string = ""

为什么优秀的程序员喜欢用第一种?因为第一种形式的短变量声明更加简洁,但是这种形式的声明通常在一个函数内部使用,不适合包级别的变量声明(即func语句的外面)。

第二种形式依赖默认初始化为空字符串的""。

第三种形式很少用,除非我们声明多个变量。

第四种形式是显式的变量类型,在类型一致的情况下是冗余的信息,在类型不一致的情况是必需的。

在实践种,我们应当使用前两种形式,使用显式的初始化来说明初始化变量的重要性,使用隐式的初始化来表明初始化变量不重要。

如上所述,每次循环,字符串s都有了新的内容。+=语句通过追加旧的字符串、空格字符和下一个参数,生成一个新的字符串,然后把新字符串赋给s。旧的内容不再需要使用,会被例行垃圾回收。

如果有大量的数据需要处理,这样的代价会比较大。一个简单且高效的方式是使用strings包中的Join函数:

1
2
3
func main() {
	fmt.Println(strings.Join(os.Args[1:]," "))
}
渝ICP备2022001449号
本站总访问量