面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。

面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。为了简化程序设计,面向过程把函数继续切分为子函数,即把大块函数通过切割成小块函数来降低系统的复杂度。

而面向对象的程序设计把计算机程序视为一组对象的集合,而每个对象都可以接收其他对象发过来的消息,并处理这些消息,计算机程序的执行就是一系列消息在各个对象之间传递。

一、类Class和实例Instance

面向对象最重要的概念就是类和实例。

  • 类是抽象的模板
  • 实例是根据类创建出来的一个个具体的“对象”

在Python中,定义类是通过class关键字:

1
2
class Student(object):
pass

class后面紧接着是类名,即Student类名通常是大写开头的单词,紧接着是(object),表示该类是从哪个类继承下来的,继承的概念我们后面再讲,通常,如果没有合适的继承类,就使用object类,这是所有类最终都会继承的类。

创建实例是通过类名+()实现

1
huffie = Student()

变量bart指向的就是一个Student的实例

二、面向对象的三大特性:封装、继承、多态

2.1 封装

(1)__init__方法

通过定义一个特殊的__init__方法,在创建实例的时候,就把namescore等属性绑上去:

1
2
3
4
5
class Student(object):

def __init__(self, name, score):
self.name = name
self.age = age

__init__方法的第一个参数永远是self,表示创建的实例本身,因此,在__init__方法内部,就可以把各种属性绑定到self,因为self就指向创建的实例本身。

有了__init__方法,在创建实例的时候,就不能传入空的参数了,必须传入与__init__方法匹配的参数,但self不需要传,Python解释器自己会把实例变量传进去:

1
huffie = Student('huffie', 22)

(2)类的方法

Student实例本身就拥有这些数据,要访问这些数据,就没有必要从外面的函数去访问,可以直接在类的内部定义访问数据的函数,这样,就把“数据”给封装起来了。这些封装数据的函数是和Student类本身是关联起来的,我们称之为类的方法。

要定义一个方法,除了第一个参数是self外,其他和普通函数一样。

1
2
3
4
5
6
7
8
class Student(object):

def __init__(self, name, score):
self.name = name
self.score = score

def print_score(self):
print('%s: %s' % (self.name, self.score))

要调用一个方法,只需要在实例变量上直接调用,除了self不用传递,其他参数正常传入:

1
bart.print_score()

(3)访问限制

类的内部可以有属性和方法,外部代码通过实例变量的方法来操作数据,这样就隐藏了内部的复杂逻辑。

但外部代码还是可以自由的修改实例的属性。

要让内部属性不被外部访问,可以把属性的名称前加上两个下划线__。在Python中,实例的变量名如果以__开头,就变成了一个私有变量(private),只有内部可以访问,外部不能访问

1
2
3
4
5
6
7
8
class Student(object):

def __init__(self, name, score):
self.__name = name
self.__score = score

def print_score(self):
print('%s: %s' % (self.__name, self.__score))

这样就确保了外部代码不能随意修改对象的属性,使代码更稳定可靠。

如果外部代码要获取name和score,或者要修改score,可以给Student类增加get_nameget_score这样的方法:

1
2
3
4
5
6
7
8
9
10
11
class Student(object):
...

def get_name(self):
return self.__name

def get_score(self):
return self.__score

def set_score(self, score):
self.__score = score

(4)类属性和实例属性

给实例绑定属性的方法是通过实例变量,或者通过self变量:

1
2
3
4
5
6
class Student(object):
def __init__(self, name):
self.name = name

s = Student('Bob')
s.score = 90

给类绑定属性可以直接在class中定义属性。

1
2
class Student(object):
name = 'Student'

类属性的特性参考以下测试:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
>>> class Student(object):
... name = 'Student'
...
>>> s = Student() # 创建实例s
>>> print(s.name) # 打印name属性,因为实例并没有name属性,所以会继续查找class的name属性
Student
>>> print(Student.name) # 打印类的name属性
Student
>>> s.name = 'Michael' # 给实例绑定name属性
>>> print(s.name) # 由于实例属性优先级比类属性高,因此,它会屏蔽掉类的name属性
Michael
>>> print(Student.name) # 但是类属性并未消失,用Student.name仍然可以访问
Student
>>> del s.name # 如果删除实例的name属性
>>> print(s.name) # 再次调用s.name,由于实例的name属性没有找到,类的name属性就显示出来了
Student

从上面的例子可以看出,在编写程序的时候,千万不要对实例属性和类属性使用相同的名字,因为相同名称的实例属性将屏蔽掉类属性,但是当你删除实例属性后,再使用相同的名称,访问到的将是类属性。

2.2 继承

定义一个class的时候,可以从某个现有的class继承,新的class称为子类(Subclass),而被继承的class称为基类、父类或超类(Base class、Super class)。

(1)继承的优点1:子类拥有父类的属性和方法

继承最大的好处是子类获得了父类的全部功能。即子类自动拥有父类的所有共有属性和方法。

举例如下,对于Dog来说,Animal就是它的父类,对于Animal来说,Dog就是它的子类。CatDog类似。

1
2
3
4
5
6
7
8
9
class Animal(object):
def run(self):
print('Animal is running...')

class Dog(Animal):
pass

class Cat(Animal):
pass

(2)继承的优点2:子类可以修改父类的方法

当子类和父类都存在相同的run()方法时,我们说,子类的run()覆盖了父类的run(),在代码运行的时候,总是会调用子类的run()。这样,我们就获得了继承的另一个好处:多态。

1
2
3
4
5
6
7
8
9
class Dog(Animal):

def run(self):
print('Dog is running...')

class Cat(Animal):

def run(self):
print('Cat is running...')

2.3 多态

首先说明,当我们定义一个class的时候,我们实际上就定义了一种数据类型。我们定义的数据类型和Python自带的数据类型,比如str、list、dict没什么两样。

在继承关系中,如果一个实例的数据类型是某个子类,那它的数据类型也可以被看做是父类。

(1)多态的优点

当新增子类时,任何依赖父类作为参数的函数或方法都可以不加修改的正常运行。即

  • 对扩展开放:允许新增父类的子类;
  • 对修改封闭:不需要修改依赖父类类型的函数。(例如def func(父类)

(2)动态语言

定义一个Animal类:

1
2
3
class Animal(object):
def run(self):
print('Animal is running...')

参考如下依赖Animal类的函数,其中调用了Animal类的方法run

1
2
3
def run_twice(animal):
animal.run()
animal.run()

对于Python这样的动态语言来说,则不一定需要传入Animal类型。我们只需要保证传入的对象有一个run()方法就可以了:

1
2
3
class Timer(object):
def run(self):
print('Start...')

即使Timer类和Animal类毫无关系,但只要他们都有run方法就可以使用依赖Animal的函数。

这就是动态语言的“鸭子类型”,它并不要求严格的继承体系,一个对象只要“看起来像鸭子,走起路来像鸭子”,那它就可以被看做是鸭子。

1
2
3
4
5
animal = Animal()
timer = Timer()

run_twice(animal)
run_twice(timer)

三、面向对象高级编程

3.1 @property

前面介绍了setget方法用来保证代码的稳定性,但这种调用方式过于复杂。因此…对于追求完美的Python程序员来说,参数的使用必须要简单!

Python内置的@property装饰器就是负责把一个方法变成属性调用的:

1
2
3
4
5
6
7
8
9
10
11
12
13
class Student(object):

@property
def score(self):
return self._score

@score.setter
def score(self, value):
if not isinstance(value, int):
raise ValueError('score must be an integer!')
if value < 0 or value > 100:
raise ValueError('score must between 0 ~ 100!')
self._score = value

把一个getter方法变成属性,只需要加上@property就可以了。
把一个setter方法变成属性,只需要加上@func_name.setter就可以了
只定义getter方法,不定义setter方法就是一个只读属性

1
2
3
4
5
6
7
8
>>> s = Student()
>>> s.score = 60 # OK,实际转化为s.set_score(60)
>>> s.score # OK,实际转化为s.get_score()
60
>>> s.score = 9999
Traceback (most recent call last):
...
ValueError: score must between 0 ~ 100!

3.2 定制类

(1)slot

定义类:

1
2
class Student(object):
pass

为实例绑定属性:

1
2
>>> s = Student()
>>> s.name = 'Michael' # 动态给实例绑定一个属性

为实例绑定方法:

1
2
3
4
5
>>> def set_age(self, age): # 定义一个函数作为实例方法
... self.age = age
...
>>> from types import MethodType
>>> s.set_age = MethodType(set_age, s) # 给实例绑定一个方法

为类绑定方法,所有实例均可调用:

1
2
3
4
>>> def set_score(self, score):
... self.score = score
...
>>> Student.set_score = set_score

上面可以看到,在定义了实例后可以任意添加实例的属性,但如果我们想要限制实例的属性怎么办。

Python允许在定义class的时候,定义一个特殊的__slots__变量,来限制该class实例能添加的属性

1
2
class Student(object):
__slots__ = ('name', 'age') # 用tuple定义允许绑定的属性名称

测试:

1
2
3
4
5
6
7
>>> s = Student() # 创建新的实例
>>> s.name = 'Michael' # 绑定属性'name'
>>> s.age = 25 # 绑定属性'age'
>>> s.score = 99 # 绑定属性'score'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'Student' object has no attribute 'score'

使用__slots__要注意,__slots__定义的属性仅对当前类实例起作用,对继承的子类是不起作用的

(2)str

我们先定义一个Student类,打印一个实例:

1
2
3
4
5
6
7
8
9
>>> class Student(object):
... def __init__(self, name):
... self.name = name
...
>>> s = Student('Michael')
>>> print(s)
<__main__.Student object at 0x109afb190>
>>> s
<__main__.Student object at 0x109afb190>

打印出一堆<__main__.Student object at 0x109afb190>,不好看。

怎么才能打印得好看呢?只需要定义好__str__()方法和__repr__方法,返回一个好看的字符串就可以了。

1
2
3
4
5
6
7
8
9
10
11
12
13
>>> class Student(object):
... def __init__(self, name):
... self.name = name
... def __str__(self):
... return 'Student object (name: %s) from __str__' % self.name
... def __repr__(self):
... return 'Student object (name: %s) from __repr__' % self.name
...
>>> s = Student('Michael')
>>> print(s)
Student object (name: Michael) from __str__
>>> s
Student object (name: Michael) from __repr__

这样打印出来的实例,不但好看,而且容易看出实例内部重要的数据。

简便写法:__repr__ = __str__

(3)getattr

正常情况下,当我们调用类的方法或属性时,如果不存在,就会报错。

要避免这个错误,除了可以加上一个score属性外,Python还有另一个机制,那就是写一个__getattr__()方法,动态返回一个属性。修改如下:

1
2
3
4
5
6
7
8
9
10
11
class Student(object):

def __init__(self):
self.name = 'Michael'

def __getattr__(self, attr):
if attr=='score':
return 99
if attr=='age':
return lambda: 25
raise AttributeError('\'Student\' object has no attribute \'%s\'' % attr)

当调用不存在的属性或方法时,就会有返回:

1
2
3
4
5
6
7
>>> s = Student()
>>> s.name
'Michael'
>>> s.score
99
>>> s.age()
25

(4)call

任何类,只需要定义一个__call__()方法,就可以直接对实例进行调用。

1
2
3
4
5
6
class Student(object):
def __init__(self, name):
self.name = name

def __call__(self):
print('My name is %s.' % self.name)

调用方式如下:

1
2
3
>>> s = Student('Michael')
>>> s() # self参数不要传入
My name is Michael.

__call__()还可以定义参数。对实例进行直接调用就好比对一个函数进行调用一样,所以你完全可以把对象看成函数,把函数看成对象,因为这两者之间本来就没啥根本的区别。

3.3 枚举类

当我们需要定义常量时,一个办法是用大写变量通过整数来定义,好处是简单,缺点是类型是int,并且仍然是变量。

更好的方法是为这样的枚举类型定义一个class类型,然后,每个常量都是class的一个唯一实例。Python提供了Enum类来实现这个功能:

1
2
3
from enum import Enum

Month = Enum('Month', ('Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'))

这样我们就获得了Month类型的枚举类,可以直接使用Month.Jan来引用一个常量。

1
2
for name, member in Month.__members__.items():
print(name, '=>', member, ',', member.value)

value属性则是自动赋给成员的int常量,默认从1开始计数。

如果需要更精确地控制枚举类型,可以从Enum派生出自定义类:

1
2
3
4
5
6
7
8
9
10
11
from enum import Enum, unique

@unique
class Weekday(Enum):
Sun = 0 # Sun的value被设定为0
Mon = 1
Tue = 2
Wed = 3
Thu = 4
Fri = 5
Sat = 6