命令行参数

大部分程序处理输入然后从产生输出，这就是关于计算的大致定义。但是程序怎样获取数据的输入呢？一些程序自己生成数据，更多的时候，输入来自一个外部源：文件、网络连接、其他程序的输出、键盘、命令行参数等。随后的一些样例将从命令行参数开始讨论这些输入。

os包提供一些函数和变量，以与平台无关的方式和操作系统打交道。命令行参数以os包中的Args名字的变量供程序访问，在os包外面，使用os.Args这个名字。

变量os.Args是一个字符串slice。slice是Go中的基础概念，很快会在接下来的教程中讨论到它。现在只需要理解它是一个动态容量的顺序数组s即可，可以通过s[i]来访问的单个元素，通过s[m:n]来访问一段连续子区间，数组用len(s)表示。与大部分编程语言一样，在Go中，所有的索引使用半开区间，即包含第一个索引，不包含最后一个索引，因为这样逻辑比较简单。例如Slice s[m:n]，其中，$0\leq m\leq n\leq len(s)$，包含n-m个元素。

os.Args的第一个元素是os.Args[0]，它是命令本身的名字；另外的元素是程序开始执行时的参数。表达式s[m:n]表示一个从第m个到第n-1个元素的slice，所以下一个示例中slice需要的元素是os.Args[1:len(os.Args)]。如果m或n缺失，默认分别是0或len(s)，所以我们可以将期望的slice简写为os.Args[1:]。

这里有一个UNIX echo命令的实现，它将命令行参数输出到一行。该实现需要导入两个包，使用由圆括号括起来的列表，而不是独立的import声明。两者都是合法的，但为了方便起见，我们使用列表的方式。导入的顺序是没有关系的，gofmt工具会将其按照字母顺序表进行排序。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16


// echo 输出其命令行参数
package main

import (
	"fmt"
	"os"
)

func main() {
	var s, sep string
	for i := 1; i < len(os.Args); i++ {
		s += sep + os.Args[i]
		sep = " "
	}
	fmt.Println(s)
}

在代码第一行中使用了注释，注释以//开头。所有以//开头的文本是给程序员看的注释，编译器将会忽略它们。在一个包声明前，我们通常会使用注释对其进行描述；

var关键字声明了两个string类型的变量s和sep。变量可以在声明的时候初始化。如果变量没有明确地初始化，它将隐式地初始化为这个类型地空值。例如，对于数字初始化的结果是0，对于字符串是空字符串""。在这个示例中，s和sep隐式初始化为空字符串。

对于数字，Go提供常规的算术和逻辑操作符。当应用于字符串时，+操作符对字符串的值进行追加操作，所以表达式

1

sep + os.Args[i]

表示将sep和os.Args[i]追加到一起。程序中使用的语句

1

s += sep + os.Args[i]

是一个赋值语句，将sep和os.Args[i]追加到旧的s上面，并且重新赋值给s，它等价于下面的语句：

1

s = s + sep + os.Args[i]

操作符+=是一个赋值运算符。每一个算数和逻辑操作符（例如+或者*）都有一个对齐的赋值操作符。

echo程序会循环每次输出，这个程序通过反复追加来构建一个字符串。字符串s一开始为空字符串""，每一次循环追加一些文本。在第一次迭代后，一个空格被插入，这样当循环结束时，每个参数之间都有一个空格。这是一个二次过程，如果参数数量很大成本会比较高，不过对于这个程序还好，之后的教程中会介绍几个改进版本。

循环的索引变量i在for循环开始处声明。:=符号用于短变量声明，这种语句声明一个或多个变量，并且根据初始化的值给予合适的类型，会在之后的教程中讨论到它。

递增语句i++对i进行加1，它等价于i += 1，又等价于i = i +1。对应的递减语句i--对i进行减1.这些是语句，而不像其他C族语言中一样是表达式，所以j = i++在Go语言中是不合法的，并且在Go中仅支持后缀，所以--i也不合法。

for是Go里面的唯一循环语句。它有几种形式，这里展示其中一种，其他几种会在之后的教程中详细介绍。

1
2
3


for initialization; condition; post {
    // 循环体：包含零个或多个语句
}

for循环的三个组成部分两边不用小括号（与C族语言，java进行区分）。大括号是必须的，但左大括号必须和post（后置）语句在同一行。

可选的initialization(初始化)语句在循环开始之前执行。如果存在，它必须是一个简单的语句，比如一个简短的变量声明，一个递增或赋值语句，或者一个函数调用。condition（条件）是一个布尔表达式，在循环的每一次迭代开始前推演，如果推演结果是真，循环则继续执行。post语句在循环体之后被执行，然后条件被再次推演，直到条件变成假之后循环才介绍。

其实三部分都是可以省略的，如果没有initialization和post语句，分号可以省略：

1
2
3
4


// C++中传统的"while"循环
for condition{
	// ...
}

如果条件部分都不存在，例子如下：

1
2
3
4


// C++中传统的无限循环
for {
	// ...
}

循环时无限的，但是这种形式的循环可以在循环体里面加上break或者return等语句进行终止。

另一种形式的for循环在字符串或者slice数据上迭代，例如上面的echo程序可以改为：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16


// echo 输出其命令行参数
package main

import (
	"fmt"
	"os"
)

func main() {
    s, sep := "", ""
	for _, arg := range os.Args[1:] {
		s += sep + arg
		sep = " "
	}
	fmt.Println(s)
}

每一次迭代，range都会产生一对值：所以和这个索引处的元素值。这个例子里，因为不需要索引，但是在语法上range循环需要处理，因此页必须处理所有。一个方法时我们将所有赋予一个临时变量（如temp）然后忽略它，但是，但是！在Go中不允许存在无用的临时变量，不然会出现错误。

在Go中的解决方案时使用空标识符，它的名字是_（即下划线）。空标识符可以用在任何语法需要变量名但是程序逻辑不需要的地方，例如丢弃每次迭代产生的无用的所以。大多数Go程序员喜欢搭配使用range和_来写上面的echo程序，因为所有在os.Args上面是隐式的，所以更不容易犯错。

同时，在这个改进的echo程序中使用了短的变量声明来声明和初始化s和sep（代码第11行），但是我们可以等价地分开声明变量。以下几种声明字符串变量地方式是等价的：

1
2
3
4


s := ""
var s string
var s = ""
var s string = ""

为什么优秀的程序员喜欢用第一种？因为第一种形式的短变量声明更加简洁，但是这种形式的声明通常在一个函数内部使用，不适合包级别的变量声明（即func语句的外面）。

第二种形式依赖默认初始化为空字符串的""。

第三种形式很少用，除非我们声明多个变量。

第四种形式是显式的变量类型，在类型一致的情况下是冗余的信息，在类型不一致的情况是必需的。

在实践种，我们应当使用前两种形式，使用显式的初始化来说明初始化变量的重要性，使用隐式的初始化来表明初始化变量不重要。

如上所述，每次循环，字符串s都有了新的内容。+=语句通过追加旧的字符串、空格字符和下一个参数，生成一个新的字符串，然后把新字符串赋给s。旧的内容不再需要使用，会被例行垃圾回收。

如果有大量的数据需要处理，这样的代价会比较大。一个简单且高效的方式是使用strings包中的Join函数：

1
2
3


func main() {
	fmt.Println(strings.Join(os.Args[1:]," "))
}