2.3 字符串基础

字符串是Python语言中另一个重要的数据类型,在Python语言中,字符串可以使用双引号(")或单引号(')将值括起来。例如,下面都是合法的字符串值。

     s1 = "hello world"
     s2 = 'I love you.'

字符串也同样可以被print函数输出到控制台,这种用法在前面已经多次使用过了。

     print("hello world")

在前面的章节尽管已经多次使用了字符串,但只涉及了字符串的一些简单用法,如定义字符串变量、输出字符串等。本节将介绍字符串的更多用法。

2.3.1 单引号字符串和转义符

微课视频

代码位置:src\basic\quotation_marks.py

字符串可以直接使用,在Python控制台中直接输入字符串,如"Hello World",会按原样输出该字符串,只不过用单引号括了起来。

     >>> "Hello World"
     'Hello World'

那么用双引号和单引号括起来的字符串有什么区别?其实没有任何区别。只不过在输出单引号或双引号时方便而已。例如,在Python控制台输入'Let's go!',会抛出如下的错误。

这是因为Python解释器无法判断字符串中间的单引号是正常的字符,还是多余的单引号,所以会抛出语法错误异常。要输出单引号的方法很多,其中之一就是使用双引号将字符串括起来。

     >>> "Let's go!"
     "Let's go!"

现在输出单引号是解决了,但如何输出双引号?其实很简单,只需要用单引号将字符串括起来即可。

     >>> '我们应该在文本框中输入"Python"'
     '我们应该在文本框中输入"Python"'

现在输出单引号和输出双引号都解决了,那么如何同时输出单引号和双引号?对于这种需求,就要使用本节要介绍的另一个知识点:转义符。Python语言中的转义符是反斜杠(\)。转义符的功能是告诉Python解释器反斜杠后面的字符是字符串中的一部分,而不是用于将字符串括起来的单引号或双引号。所以如果字符串中同时包含单引号和双引号,那么转义符是必需的。

在上面这行代码中,单引号和双引号都是用的转义符,其实在这个例子中,由于字符串是由单引号括起来的,所以如果里面包含双引号,是不需要对双引号使用转义符的。

下面的例子演示了Python语言中单引号和双引号的用法,以及转义符在字符串中的应用。

     # 使用单引号的字符串,输出结果:Hello World
     print('Hello World')
     # 使用双引号的字符串,输出结果:Hello World
     print("Hello World")
     #  字符串中包含单引号,输出结果:Let's go!
     print("Let's go!")
     #  字符串中包含双引号,输出结果:"一起走天涯"
     print('"一起走天涯"')
     #  字符串中同时包含单引号和双引号,其中单引号使用了转义符,输出结果:Let's go! "一人我饮酒醉"
     print('Let\'s go! "一人我饮酒醉" ')

2.3.2 拼接字符串

微课视频

代码位置:src/basic/join_string.py

在输出字符串时,有时字符串会很长,在这种情况下,可以将字符串写成多个部分,然后拼接到一起。可以尝试下面的一种写法。

     >>> 'Hello' 'world'
     'Helloworld'

这种写法是将两个字符串挨着写到一起,字符串中间可以有0~n个空格。现在看这种方式能否将两个字符串变量的值组合到一起。

可以看到,如果是两个字符串类型的变量紧挨着写在一起,Python解释器就会认为是语法错误,所以这种方式实际上并不是字符串的拼接,只是一种写法而已,而且这种写法必须是两个或多个字符串值写在一起,而且不能出现变量,否则Python解释器就会认为是语法错误。

如果要连接字符串,要用加号(+),也就是字符串的加法运算。

     >>> x = 'Hello '
     >>> x + 'World'
     'Hello World'

2.3.3 保持字符串的原汁原味

微课视频

代码位置:src/basic/str_repr.py

在2.3.1节已经讲过转义符(\)的应用,其实转义符不光能输出单引号和双引号,还能控制字符串的格式,例如,使用"\n"表示换行,如果在字符串中含有"\n",那么"\n"后的所有字符都会被移到下一行。

     >>> print('Hello\nWorld')
     Hello
     World

如果要混合输出数字和字符串,并且换行,可以先用str函数将数字转换为字符串,然后在需要换行的地方加上"\n"。

     >>> print(str(1234) + "\n" + str(4321))
     1234
     4321

不过有时不希望Python解析器转义特殊字符,希望按原始字符串输出,这时需要使用repr函数。

     >>> print(repr("Hello\nWorld"))
     'Hello\nWorld'

使用repr函数输出的字符串,会使用一对单引号括起来。

其实如果只想输出"\n"或其他类似的转义符,也可以使用两个反斜杠输出"\",这样"\"后面的n就会被认为是普通的字符。

     >>> print("Hello\\nWorld")
     Hello\nWorld

除了前面介绍的repr和转义符外,在字符串前面加r也可以原样输出字符串。

     >>> print(r"Hello\nWorld")
     Hello\nWorld

现在总结一下,让一个字符串按原始内容输出(不进行转义),有如下3种方法。

· repr函数。

· 转义符(\)。

· 在字符串前面加r。

下面的例子完整地演示了str和repr函数的用法。

这段代码在使用repr函数输出的"<hello\nworld>"字符串被一对单引号括了起来,而且字符串长度是16。而使用str函数输出同样的字符串,长度是13。在str函数输出的字符串中,"\n"算一个字符,长度为1,而用repr函数输出的字符串中,"\n"是两个字符,长度为2。再加上一对单引号,所以长度是16。

2.3.4 长字符串

微课视频

代码位置:src/basic/long_string.py

使用3个单引号或双引号括起来的文本会成为一个长字符串。在长字符串中会保留原始的格式。

如果使用长字符串表示一个字符串,中间可以混合使用双引号和单引号,而不需要加转义符。

对于普通字符串来说,同样可以用多行来表示。只需要在每行后面加转义符(\),这样一来,换行符本身就"转义"了,会被自动忽略,所以最后都会变成一行字符串。

下面的代码演示了长字符串的用法。

程序运行结果如图2-4所示。

图2-4 输出长字符串