本文共 9216 字,大约阅读时间需要 30 分钟。
Python有6种标准数据类型:数字、字符串、列表、元组、集合和字典,列表、元组、集合和字典可以保存多项数据,他们每一个都是一种数据结构,本书中把他们统称为“数据结构”类型。
本章先介绍数字和字符串,列表、元组、集合和字典数据类型后面章节会详细介绍。
Python数字类型有4种:整数类型、浮点类型、复数类型和布尔类型。需要注意的是布尔类型也是数字类型,它事实上是整数类型的一种。
Python整数类型为int,整数类型的范围可以很大,可以表示很大的整数,这只受所在计算机硬件的限制。
给Python 2的提示 Python
3不再区分整数和长整数,只要你需要所有的整数都可以是长整数。
默认情况下一个整数值,例如16表示的十进制整数。那么其他进制,如二进制数、八进制数和十六进制整数表示方式如下:
二进制数:以 0b 或0B为前缀,注意0是阿拉伯数字,不要误认为是英文字母o。
八进制数,以0o或0O为前缀,第一个字符是阿拉伯数字0,第二个字符是英文字母o或O。
例如整数值28、0b11100、0B11100、0o34、0O34、0x1C和0X1C都同一个数字。在Python
Shell输出结果如下:>>> 2828>>> 0b1110028>>> 0O3428>>> 0o3428>>> 0x1C28>>> 0X1C28
浮点类型主要用来储存小数数值,Python浮点类型为float,Python只支持双精度浮点类型,而且是与本机相关。
浮点类型可以使用小数表示,也可以使用科学计数法表示,科学计数法中会使用大写或小写的e表示10的指数,如e2表示102。
在Python Shell中运行示例如下:
>>> 1.01.0>>> 0.00.0>>> 3.36e2336.0>>> 1.56e-20.0156
其中3.36e2表示的是3.36×102,1.56e-2表示的是1.56×10-2。
复数在数学中是非常重要的概念,无论是理论物理学,还是电气工程实践中都经常使用。但是很多计算机语言都不支持复数,而Python是支持复数的,这使得Python能够很好地用来进行科学计算。
Python中复数类型为complex,例如1+2j表示的是实部1,虚部2的复数。在Python
Shell中运行示例如下:>>> 1+2j(1+2j)>>> (1+2j) + (1+2j)(2+4j)
上述代码实现了两个复数(1+2j)的相加。
Python中布尔类型为bool,bool是int的子类,它只有两个值:True和False。
注意
任何类型数据都可以通过bool()函数转换为布尔值,那些被认为“没有的”、“空的”值会转换为False,反之转换为True。如None(空对象)、False、0、0.0、0j(复数)、''(空字符串)、[](空列表)、()(空元组)和{}(空字典)这些数值会转换为False,否则是True。
示例如下:
>>> bool(0)False>>> bool(2) True>>> bool(1)True>>> bool('')False>>> bool(' ')True>>> bool([])False>>> bool({})False
上述代码中bool(2)和bool(1)表达式输出的True,这说明2和1都能转换为Ture,在整数中只有0是转换为False的,其他类型亦是如此。
学习了前面的数据类型后,大家会思考一个问题,数据类型之间是否可以转换呢?Python通过了一些函数可以实现不同数据类型之间的转换。如:数字类型之间互相转换以及整数与字符串之间的转换。本节先讨论数字类型的互相转换。
除复数外,其他的三种数字类型整数、浮点和布尔都可以互相进行转换,转换分为隐式类型转换和显式类型转换。
多个数字类型数据之间可以进行数学计算,由于参与进行计算的数字类型可能不同,此时会发生隐式类型转换。计算过程中隐式类型转换规则如表6-1所示。
表 6‑1隐式类型转换规则
操作数1类型 | 操作数2类型 | 转换后的类型 |
---|---|---|
布尔 | 整数 | 整数 |
布尔、整数 | 浮点 | 浮点 |
布尔数值可以隐式转换为整数类型,布尔值True转换为整数1,布尔值False转换整数0。在Python
Shell中运行示例如下:>>> a = 1 + True>>> print(a)2>>> a = 1.0 + 1>>> type(a) ①>>> print(a)2.0>>> a = 1.0 + True>>> print(a)2.0>>> a = 1.0 + 1 + False>>> print(a)2.0
从上述代码表达式的运算结果类型,可知表6-1所示的类型转换规则,这里不再赘述。另外,上述代码第①行使用了type()函数,
type()函数可以返回传入数据的类型,\<class 'float'\>说明是浮点类型。在不能进行隐式转换情况下,则可以使用转换函数进行显式转换了。除复数外,三种数字类型整数、浮点和布尔都有自己的转换函数,分别是int()、float()和bool()函数,bool()函数在6.1.4节已经介绍过了,这里不再赘述。
int()函数可以将布尔、浮点和字符串转换为整数。布尔数值True使用int()函数返回1,False使用int()函数返回0;浮点数值使用int()函数会截掉小数部分。int()函数转换字符串会在下一节再介绍。
float()函数可以将布尔、整数和字符串转换为浮点。布尔数值True使用float()函数返回1.0,False使用float()函数返回0.0;整数值使用float()函数会加上小数部分(.0)。float()函数转换字符串会在下一节再介绍。
在Python Shell中运行示例如下:
>>> int(False)0>>> int(True)1>>> int(19.6)19>>> float(5)5.0>>> float(False)0.0>>> float(True)1.0
由字符组成的一串字符序列,称为“字符串”,字符串是有顺序的,从左到右,索引从0开始依次递增。Python中字符串类型是str。
Python中字符串表示方式三种:
普通字符串。采用单引号(')或双引号(")包裹起来的字符串。
原始字符串(raw
string)。在普通字符串前加r,字符串中的特殊字符不需要转义,按照字符串的本来“面目”呈现。很多程序员习惯于使用单引号(')表示字符串。下面示例表示的都是Hello World字符串:
'Hello World'"Hello World"'\u0048\u0065\u006c\u006c\u006f\u0020\u0057\u006f\u0072\u006c\u0064' ①"\u0048\u0065\u006c\u006c\u006f\u0020\u0057\u006f\u0072\u006c\u0064" ②
Python中的字符采用Unicode编码,所以字符串可以包含中文等亚洲字符。代码第①行和第②行的字符串是用Unicode编码表示的字符串,事实上它表示的也是Hello
World字符串,可通过print函数将Unicode编码表示的字符串输出到控制台,则会看到HelloWorld字符串。在Python Shell中运行示例如下:>>> s = 'Hello World'>>> print(s)Hello World>>> s = "Hello World">>> print(s)Hello World>>> s = '\u0048\u0065\u006c\u006c\u006f\u0020\u0057\u006f\u0072\u006c\u0064'>>> print(s)Hello World>>> s = "\u0048\u0065\u006c\u006c\u006f\u0020\u0057\u006f\u0072\u006c\u0064">>> print(s)Hello World
如果想在字符串中包含一些特殊的字符,例如换行符、制表符等在普通字符串中则需要转义,前面要加上反斜杠(\),这称为字符转义。表6-2所示是常用的几个转义符。
表 6‑2 转义符
字符表示 | Unicode编码 | 说 明 |
---|---|---|
\t | \u0009 | 水平制表符 |
\n | \u000a | 换行 |
\r | \u000d | 回车 |
\" | \u0022 | 双引号 |
\' | \u0027 | 单引号 |
\\ | \u005c | 反斜线 |
在Python Shell中运行示例如下:
>>> s = 'Hello\n World'>>> print(s)Hello World>>> s = 'Hello\t World'>>> print(s)Hello World>>> s = 'Hello\' World'>>> print(s)Hello' World>>> s = "Hello' World" ①>>> print(s)Hello' World>>> s = 'Hello" World' ②>>> print(s)Hello" World>>> s = 'Hello\\ World' ③>>> print(s)Hello\ World>>> s = 'Hello\u005c World' ④>>> print(s)Hello\ World
对于字符串中的单引号(')和双引号(")也可以不要转义符,在包含单引号的字符串中使用双引号包裹字符串,见代码第①行;在包含双引号的字符串中使用单引号包裹字符串,见代码第②行。另外,可以在使用Unicode编码替代需要转义的特殊字符,代码第④行与代码第③是等价的。
在普通字符串前面加字母r,表示字符串是原始字符串,原始字符串是直接按照字符串的字面意思来使用,没有转义字符。在Python
Shell中运行示例代码如下:>>> s = 'Hello\tWorld' ①>>> print(s)Hello World>>> s = r'Hello\tWorld' ②>>> print(s)Hello\tWorld
代码第①是普通字符串,代码第②是原始字符串,他们的区别只是在字符串前面加字母r。从输出结果可见,原始字符串中的\t没有被当成制表符使用。
字符串中包含了换行缩进等排版字符,则可以使用长字符串。在Python
Shell中运行示例代码如下:>>> s ='''Hello World'''>>> print(s)Hello World>>> s = """ Hello \t ① World""">>> print(s) Hello World
在长字符串中如果包含特殊字符,也需要转义的,见代码第①行。
在实际的编程过程中,经常会遇到将其他类型变量与字符串拼接到一起,并进行格式化输出。例如计算的金额需要保留小数点后四为、数字需要右对齐等,这些都需要格式化。
在字符串格式化时可以使用字符串的format()方法,以及占位符。在Python
Shell中运行示例如下:>>> name = 'Mary'>>> age = 18>>> s = '她的年龄是{0}岁。'.format(age) ①>>> print(s)她的年龄是18岁。>>> s = '{0}芳龄是{1}岁。'.format(name, age) ②>>> print(s)Mary芳龄是18岁。>>> s = '{1}芳龄是{0}岁。'.format(age, name) ③>>> print(s)Mary芳龄是18岁。>>> s = '{n}芳龄是{a}岁。'.format(n=name, a=age) ④>>> print(s)Mary芳龄是18岁。
字符串中可以有占位符({}表示的内容),配合format()方法使用,会将format()方法中的参数替换占位符内容。占位符可以用参数索引表示,见代码第①行、第②行和第③行,也可以使用参数的名字表示占位符,见代码第④行,n和a都是参数名字。
占位符中还可以有格式化控制符,对字符串的格式进行更加精准控制。不同的数据类型在进行格式化时需要不同的控制符,这些格式化控制符如表6-3所示。
表 6‑3字符串格式化控制符
控制符 | 说 明 |
---|---|
s | 字符串格式化 |
d | 十进制整数 |
f、F | 十进制浮点数 |
g、G | 十进制整数或浮点数 |
e、E | 科学计算法表示浮点数 |
o | 八进制整数,符号是小英文字母o |
x、X | 十六进制整数,x是小写表示,X是大写表示 |
格式控制符是位于占位符索引或占位符名字的后面,之间用冒号分隔,例如{1:d}表示索引为1的占位符格式参数是十进制整数。在Python
Shell中运行示例如下:>>> name = 'Mary'>>> age = 18>>> money = 1234.5678>>> "{0}芳龄是{1:d}岁。".format(name, age) ① 'Mary芳龄是18岁。'>>> "{1}芳龄是{0:5d}岁。".format(age, name) ②'Mary芳龄是 18岁。'>>> "{0}今天收入是{1:f}元。".format(name, money) ③'Mary今天收入是1234.567800元。'>>> "{0}今天收入是{1:.2f}元。".format(name, money) ④'Mary今天收入是1234.57元。'>>> "{0}今天收入是{1:10.2f}元。".format(name, money) ⑤'Mary今天收入是 1234.57元。'>>> "{0}今天收入是{1:g}元。".format(name, money) 'Mary今天收入是1234.57元。'>>> "{0}今天收入是{1:G}元。".format(name, money) 'Mary今天收入是1234.57元。'>>> "{0}今天收入是{1:e}元。".format(name, money) 'Mary今天收入是1.234568e+03元。'>>> "{0}今天收入是{1:E}元。".format(name, money) 'Mary今天收入是1.234568E+03元。'>>> '十进制数{0:d}的八进制表示为{0:o},十六进制表示为{0:x}'.format(28) '十进制数28的八进制表示为34,十六进制表示为1c'
上述代码第①行中{1:d}是格式化十进制整数,代码第②行中{0:5d}是指定输出长度为5的字符串,不足用空格补齐。代码第③行中{1:d}是格式化十进制浮点数,从输出的结果可见,小数部分太长了,如果想控制小数部分可以使用代码第④行的{1:.2f}占位符,其中表示保留小数两位(四舍五入)。如果想设置长度可以使用代码第⑤行的{1:10.2f}占位符,其中10表示总长度,包括小数点和小数部分,不足用空格补位。
在给定的字符串中查找子字符串是比较常见的操作。字符串类(str)中提供了find和rfind方法用于查找子字符串,返回值是查找子字符串所在的位置,没有找到返回-1。下面只具体说明find和rfind方法。
str.find(sub[, start[,
end]])。在索引start到end之间查找子字符串sub,如果找到返回最左端位置的索引,如果没有找到返回-1。start是开始索引,end是结束索引,这两个参数都可以省略,如果start省略说明查找从字符串头开始;如果end省略说明查找到字符串尾结束;如果全部省略就是查找全部字符串。提示 在Python文档中[]表示可以省略部分,find和rfind方法参数[, start[,
end]]表示start和end都可以省略。
在Python Shell中运行示例代码如下:
>>> source_str = "There is a string accessing example.">>> len(source_str) ①36>>> source_str[16] ②'g'>>> source_str.find('r') 3>>> source_str.rfind('r')13>>> source_str.find('ing')14>>> source_str.rfind('ing')24>>> source_str.find('e', 15)21>>> source_str.rfind('e', 15)34>>> source_str.find('ing', 5)14>>> source_str.rfind('ing', 5)24>>> source_str.find('ing', 18, 28)24>>> source_str.rfind('ingg', 5)-1
上述代码第①行len(source_str)返回字符串长度,注意len是函数,不是字符串的一个方法,它的参数是字符串。代码第②行source_str[16]访问字符串中索引16的字符。
上述字符串查找方法比较类似,这里重点解释一下source_str.find('ing',
5)和source_str.rfind('ing',5)表达式。从图6-1可见ing字符串出现过两次,索引分别是14和24。source_str.find('ing',5)返回最左端索引14,返回值为14;source_str.rfind('ing', 5)返回最右端索引24。提示
函数与方法的区别?方法是定义在类中的函数,在类的外部调用时需要通过类或对象调用,例如上述代码source_str.find('r')就是调用字符串对象source_str的find方法,find方法是在str类中定义的。而通常的函数不是类中定义的,也称为顶层函数,他们不属于任何一个类,调用时直接使用函数即可,例如上述代码中的len(source_str),就是调用len函数,只不过它的参数是字符串对象source_str。
在实际的编程过程中,经常会用到字符串与数字相互转换。下面从两个不同的方面介绍字符串与数字相互转换。
字符串转换为数字可以使用int()和float()实现,这两个函数在6.2.2节介绍了实现数字类型之间的转换,事实上这两个函数也可以接收字符串参数,如果字符串能成功转换为数字,则返回数字,否则引发异常。
在Python Shell中运行示例代码如下:
>>> int('9')9>>> int('9.6')Traceback (most recent call last): File "", line 1, in int('9.6')ValueError: invalid literal for int() with base 10: '9.6'>>> float('9.6')9.6>>> int('AB')Traceback (most recent call last): File " ", line 1, in int('AB')ValueError: invalid literal for int() with base 10: 'AB'>>>
默认情况下int()函数都将字符串参数当成是十进制数字进行转换,所以int('AB')会失败。int()函数也可以指定基数(进制),在Python
Shell中运行示例如下:>>> int('AB', 16)171
数字转换字符串有很多种方法,6.3.2节介绍的字符串格式化可以实现将数字转换为字符串。另外,Python中字符串提供了str()函数。
可以使用str()函数可以将任何类型的数字都转换为字符串。在Python
Shell中运行示例代码如下:>>> str(3.24)'3.24'>>> str(True)'True'>>> str([])'[]'>>> str([1,2,3])'[1, 2, 3]'>>> str(34)'34'
从上述代码可以str()函数很强大,什么类型都可以转换。但缺点是不能格式化,如果格式化字符串需要使用format函数。在Python
Shell中运行示例代码如下:>>> '{0:.2f}'.format(3.24)'3.24'>>> '{:.1f}'.format(3.24)'3.2'>>> '{:10.1f}'.format(3.24)' 3.2'
提示 在格式化字符串时,如果只有一个参数,占位符索引可以省略。
本章主要介绍了Python中的数据类型,读者需要重点掌握数字类型与字符串类型,熟悉数字类型互相转换,以及数字类型与字符串之间的转换。
作者微博:@tony_关东升
转载地址:http://njloo.baihongyu.com/