Cộng đồng chia sẻ tri thức Doc24.vn

Kiểu dữ liệu function trong Python – Yield

Gửi bởi: Phạm Thọ Thái Dương vào ngày 2020-11-20 08:28:47

Mục lục
* * * * *

Nhắc lại khái niệm iterables

Khi bạn tạo  ra một list, bạn có thể truy xuất lần lượt từng giá trị của list đó. Người ta gọi đó là iteration

>>> kteam_lst = [1, 'Kteam', 2]
>>> for value in kteam_lst:
...     print(value)
...
1
Kteam
2
12345678

“kteam_lst” ở đây được gọi là một iterable. Mọi thứ mà bạn có thể dùng cú pháp “for … in …” đều là một iterable. Ví dụ như chuỗi, list, tuple, file,..

Nhưng iterable này rất thuận tiện cho chúng ta lưu dữ và truy xuất thông tin. Và để được như vậy bạn phải lưu trữ những thông tin đó trong các vùng nhớ máy tính của bạn. Vì lẽ đó, sẽ có trường hợp bạn không cần thiết phải giữ tất cả thông tin cùng một lúc vì nó quá nhiều.

Giới thiệu generator

Generator là iterator, một dạng của iterable nhưng khác ở chỗ bạn không thể tái sử dụng. Vì sao lại như vậy? Generator không lưu trữ tất cả các giá trị của bạn ở bộ nhớ, mà nó sinh ra lần lượt

>>> kteam_gen = (value for value in range(3))
>>> for value in  kteam_gen:
...     print(value)
...
0
1
2
12345678

Như đã nói, generator cũng là một iterable, nên nó cũng khá tương tự như khi bạn dùng list hoặc tuple. Nhưng, nếu bạn thử tái sử dụng generator đó

>>> for value in kteam_gen:
...     print(value)
...
>>>
12345

Bạn thấy đấy, không có giá trị nào được in ra. Bởi vì khi nó sinh ra giá trị đầu tiên là 0, khi bạn kêu nó sinh tiếp giá trị 1, nó sẽ vứt bỏ giá trị 0 để nhường chỗ cho giá trị 1, và nếu bạn tiếp tục yêu cầu sinh thêm giá trị nó sẽ lại tiếp tục công việc như cũ cho tới khi kết thúc.

Lệnh yield

Các bạn chú ý: y-i-e-l-d, yield. Lệnh này khá là khó nhớ đặc biệt với những người chưa quen với tiếng Anh. Bạn cũng nên tra google để biết ý nghĩa của từ yield. Điều này sẽ giúp bạn biết rõ hơn lệnh này.

Lệnh này cách sử dụng gần giống với lệnh return, tuy nhiên nó khác return ở chỗ trả về một object thì yield sẽ trả về một generator.

Chúng ta hãy đến với một ví dụ với return sau đó ta sẽ so sánh nó với yield

>>> def square(lst):
...     sq_lst = []
...     for num in lst:
...             sq_lst.append(num**2)
...     return sq_lst
...
>>> kteam_ret = square([1, 2, 3])
>>> for value in kteam_ret:
...     print(value)
...
1
4
9
1234567891011121314

Và đây là khi sử dụng lệnh yield thay cho return

>>> def square(lst):
...     for num in lst:
...             yield num**2
...
>>> kteam_gen = square([1, 2, 3])
>>> for value in kteam_gen:
...     print(value)
...
1
4
9
123456789101112

Như bạn thấy, vì return sẽ quăng lại một list lưu trữ toàn bộ giá trị sau khi bình phương, thế nên bạn phải tạo một list để lưu hết những giá trị đó. Tuy nhiên, điều này là không cần thiết với yield. Nó sẽ lần lượt sinh ra từng giá trị bình phương một mà không cần một list để lưu trữ. Mỗi lần bạn gọi nó, nó sẽ chạy vào sinh ra cho bạn giá trị bạn cần như việc bạn sử dụng vòng lặp for để đọc từng giá trị trong một list.

Khi bạn dùng yield trong một hàm và khi gọi hàm đó, những dòng lệnh trong hàm sẽ không chạy ngay. Nó trả về một generator. Và mỗi khi bạn yêu cần nó sinh thì nó mới bắt đầu chạy vào bên trong thực hiện những dòng lệnh trong hàm CHO TỚI KHI GẶP LỆNH YIELD và nó sẽ sinh ra giá trị bạn yêu cầu yield, hàm bây giờ được tạm dừng. Bạn cần lưu ý, là chỉ tạm dừng, có nghĩa là nếu lần sau gọi, hàm sẽ tiếp tục chạy ở phần đó không phải chạy lại từ đầu

Khi nào thì yield hết? Khi mà nó đi hết phần còn lại của hàm mà không gặp lệnh yield.

Bạn sẽ hiểu rõ hơn khi xem hai ví dụ sau đây.

>>> def gen():
...     for value in range(3):
...             print('yield', value + 1, 'times')
...             yield value
...
>>> for value in gen():
...     print(value)
...
yield 1 times
0
yield 2 times
1
yield 3 times
2
123456789101112131415
>>> def gen():
...     yield 'Kteam'
...     print('this is the second yield')
...     yield 'Free education'
...     print('this is the last yield')
...     yield 'Long đẹp trai'
...     print('Will not return anything')
...
>>> for value in test():
...     print(value)
Kteam
this is the second yield
Free education
this is the last yield
Long đẹp trai
Will not return anything
1234567891011121314151617

Bạn cũng cần lưu ý thêm, nếu không có giá trị yield khi được gọi tiếp thì sẽ yield sẽ không  trả về bất cứ thứ gì, có nghĩa là None object cũng không được trả về.

Phương thức send

Lưu ý: Bạn đọc cần đọc và ngẫm thật kĩ yield ở phía trên trước khi đọc đến phần này.

Đây là phương thức giúp bạn gửi giá trị vào trong một generator.

Cú pháp:

generator.send(value)

Bạn cũng không cần phải lo lắng nếu không hiểu được đoạn code dưới đây

>>> def gen():
...     for i in range(4):
...             x = yield i
...             print('value sent from you', x)
...
>>> g = gen() # gán generator này cho biến g
>>> next(g) # gọi hàm next để chạy lệnh yield "x = yield i"
0
>>> g.send('Kteam') # x vừa nãy khi gán cho biến yield giờ sẽ được gửi giá trị
value sent from you Kteam
1
>>> g.send('Free education')
value sent from you Free education
2
>>> next(g) # lần này ta không dùng send, mặc định giá trị gửi vào là None
value sent from you None
3
123456789101112131415161718

Đây là một ví dụ khác nữa về phương thức send. Một lần nữa, hãy coi thật kĩ ví dụ send vừa trên trước khi đến với ví dụ tiếp sau đây

>>> def gen():
...     while True:
...             x = yield # ở đây ta đang yield None, vì ta không cần thiết sinh giá trị gì ở  đây
...             yield x ** 2
...
>>> g = gen()
>>> next(g) # chạy lệnh yield để ta gửi giá trị cho biến x lần sau
>>> g.send(2)
4
>>> next(g) # tiếp tục chạy yield để có thể gửi giá trị
>>> g.send(10)
100
12345678910111213

Vì sao nên dùng yield

Tốc độ, khi sử dụng generator, để duyệt các giá trị thì generator sẽ nhanh hơn khi khi bạn duyệt một iterable lưu trữ một lúc tất cả các giá trị

Bộ nhớ, bạn sẽ phải cân nhắc việc dùng yield khi bạn làm việc với những tập dữ liệu lớn. Lúc đó, bạn sẽ phải xem xét lại xem liệu bạn có cần giữ tất cả các giá trị một lúc không hay chỉ cần sinh ra từng giá trị một để tiết kiệm bộ nhớ.

Còn một số ưu điểm nữa của yield, bạn đọc có thể tham khảo câu trả lời sau trên Stack Overflow:

https://stackoverflow.com/questions/102535/what-can-you-use-python-generator-functions-for

Đáp án bài trước

Bạn có thể tìm thấy câu hỏi của phần này tại CÂU HỎI CỦNG CỐ trong bài  KIỂU DỮ LIỆU FUNCTION TRONG PYTHON – RETURN

1.

def f_x(x):
    return x**3 + 2 * x**2 - 4 * x + 1

def check_point(x, y):
    if y == f_x(x):
        return True
    return False

def fil_point(lst_point):
    lst_A, lst_B = [], []
    for l in lst:
        if check_point(*l):
            lst_A.append(l)
            continue
        lst_B.append(l)
    return lst_A, lst_B

def cal_sum(lst):
    s = 0
    for value in lst:
        s += value[1]
    return s

lst = [(-5, -20), (-4, -15), (-3, 4), (-2, 9), (-1, 7), (0, 1)
, (1, -7), (2, -9), (4, 81), (5, 130)]

lst_A_after, lst_B_after = fil_point(lst)
print(abs(cal_sum(lst_A_after) - cal_sum(lst_B_after)))
1234567891011121314151617181920212223242526272829

2.

def find_max(x, y):
    return int((x + y + abs(x - y))/2)

a = 32
b = 59
c = 8
d = 24
e = 15

_max = find_max(find_max(find_max(find_max(a, b), c), d), e)
print(2 * _max - 1)
Lượt xem: 1011

Các bài học liên quan