最近我在写一个视频网站的爬虫,项目已经完成,中间有不少需要总结的经验,写文章记录下来。

从Python 3.6开始,f-Strings是格式化字符串的一种很棒的新方法。与其他格式化方式相比,它们不仅更具可读性,更简洁且不易出错,而且速度更快!

Python中的“老式”字符串格式化

在Python 3.6之前,你有两种主要的方式,将Python表达式嵌入到字符串文字中进行格式化:%-formatting和str.format()。本文将首先介绍如何使用它们以及它们的局限性。

选项#1:%-formatting

这是Python格式化的OG,从一开始就存在于语言中。你可以在Python文档中阅读更多内容。请记住,文档不建议使用%格式,其中包含以下注意事项:

“这里描述的格式化操作表现出各种古怪问题,导致许多错误(例如未能正确显示元组和字典)。

使用较新的格式化字符串文字或str.format()方法有助于避免这些错误。这些替代方案还提供了更强大,灵活和可扩展的文本格式设置方法。”

如何使用 %-formatting

字符串对象具有使用该%运算符的内置操作,可用于格式化字符串。这是实际的情况:

>>> name = "Eric"
>>> "Hello, %s." % name
'Hello, Eric.'

为了插入多个变量,你必须使用这些变量的元组。这是你要执行的操作:

>>> name = "Eric"
>>> age = 74
>>> "Hello, %s. You are %s." % (name, age)
'Hello Eric. You are 74.'

为什么%-formatting不好

上面看到的代码示例具有足够的可读性。但是,一旦开始使用多个参数和更长的字符串,你的代码将很快变得不那么易读。看起来有些混乱:

>>> first_name = "Eric"
>>> last_name = "Idle"
>>> age = 74
>>> profession = "comedian"
>>> affiliation = "Monty Python"
>>> "Hello, %s %s. You are %s. You are a %s. You were a member of %s." % (first_name, last_name, age, profession, affiliation)
'Hello, Eric Idle. You are 74. You are a comedian. You were a member of Monty Python.'

这种格式不是很好,因为它很冗长并且会导致错误,例如不能正确显示元组或字典。

选项#2:str.format()

Python 2.6中引入了这种完成工作的新方法。你可以查看《 Python字符串格式新手指南》以获取更多信息。

如何使用str.format()

str.format() 是对 %-formatting 的改进。它使用正常的函数调用语法,并且可以通过 format() 方法对被转换为字符串的对象进行扩展。

使用str.format(),替换字段用花括号标记:

>>> "Hello, {}. You are {}.".format(name, age)
'Hello, Eric. You are 74.'

你可以通过引用变量的索引以任何顺序引用它们:

>>> "Hello, {1}. You are {0}.".format(age, name)
'Hello, Eric. You are 74.'

但是,如果你插入变量名,则会获得以下额外的好处:能够传递对象,然后在花括号之间引用参数和方法:

>>> person = {'name': 'Eric', 'age': 74}
>>> "Hello, {name}. You are {age}.".format(name=person['name'], age=person['age'])
'Hello, Eric. You are 74.'

你也可以使用**字典来完成这个巧妙的技巧:

>>> person = {'name': 'Eric', 'age': 74}
>>> "Hello, {name}. You are {age}.".format(**person)
'Hello, Eric. You are 74.'

str.format() 与%格式相比绝对是一个升级。

为什么 str.format() 不好

使用str.format()代码比使用 %-formatting 的代码更容易阅读,但是str.format()当你处理多个参数和更长的字符串时,代码仍然很冗长。看看这个:

>>> first_name = "Eric"
>>> last_name = "Idle"
>>> age = 74
>>> profession = "comedian"
>>> affiliation = "Monty Python"
>>> print(("Hello, {first_name} {last_name}. You are {age}. " + 
>>>        "You are a {profession}. You were a member of {affiliation}.") \
>>>        .format(first_name=first_name, last_name=last_name, age=age, \
>>>                profession=profession, affiliation=affiliation))
'Hello, Eric Idle. You are 74. You are a comedian. You were a member of Monty Python.'

如果你要.format()在字典中传递变量,则可以将其解压缩.format(**some_dict)并按字符串中的键引用值,但是必须有一种更好的方法来执行此操作。

f-Strings表达式:Python中一种增强的格式化字符串的新方法

f-Strings 表达式使格式化更容易。他们加入了Python 3.6。你可以在2015年8月由Eric V.Smith撰写的PEP 498中阅读全部内容。

f-Strings 也称为“格式化的字符串文字”,是一种字符串文字,其开头是 f,后面是大括号,其中包含将被替换为其值的表达式。这些表达式在运行时被评估,然后使用 "format" 协议进行格式化。当你想了解更多信息时,Python文档是你的朋友。

下面是一些 f-strings 可以让你的生活更轻松的方法。

简单语法

看看这是多么容易阅读:

>>> name = "Eric"
>>> age = 74
>>> f"Hello, {name}. You are {age}."
'Hello, Eric. You are 74.'

使用大写字母也是有效的F

>>> F"Hello, {name}. You are {age}."
'Hello, Eric. You are 74.'

任意表达

因为 f-strings 在运行时被评估,所以您可以在其中放入任何和所有有效的 Python 表达式。

你可以做一些非常简单的事情,例如:

>>> f"{2 * 37}"
'74'

但是你也可以调用函数。这是一个例子:

>>> def to_lowercase(input):
...     return input.lower()

>>> name = "Eric Idle"
>>> f"{to_lowercase(name)} is funny."
'eric idle is funny.'

你还可以选择直接调用方法:

>>> f"{name.lower()} is funny."
'eric idle is funny.'

你甚至可以使用从带有f-strings的类创建的对象:

class Comedian:
    def __init__(self, first_name, last_name, age):
        self.first_name = first_name
        self.last_name = last_name
        self.age = age

    def __str__(self):
        return f"{self.first_name} {self.last_name} is {self.age}."

    def __repr__(self):
        return f"{self.first_name} {self.last_name} is {self.age}. Surprise!"

你执行以下操作:

>>> new_comedian = Comedian("Eric", "Idle", "74")
>>> f"{new_comedian}"
'Eric Idle is 74.'

__str__()__repr__()方法处理对象是如何呈现为字符串,所以你需要确保你包括你的类定义这些方法的至少一个。如果你必须选择一个,请继续使用,__repr__()因为它可以代替使用__str__()

返回的__str__()字符串是对象的非正式字符串表示形式。返回的字符串__repr__()是正式表示形式,应明确。调用str()repr()比直接使用__str__()和更可取__repr__()

默认情况下,f字符串将使用__str__(),但是如果你加入转换标志 !r,你可以确保它们使用__repr__()

>>> f"{new_comedian}"
'Eric Idle is 74.'
>>> f"{new_comedian!r}"
'Eric Idle is 74. Surprise!'

如果你想阅读一些导致 f-Strings 支持完整Python表达式的对话,则可以在此处进行

多行f-Strings

你可以使用多行字符串:

>>> name = "Eric"
>>> profession = "comedian"
>>> affiliation = "Monty Python"
>>> message = (
...     f"Hi {name}. "
...     f"You are a {profession}. "
...     f"You were in {affiliation}."
... )
>>> message
'Hi Eric. You are a comedian. You were in Monty Python.'

但是请记住,你需要在多行字符串的每一行前面放一个f。以下代码不起作用:

>>> message = (
...     f"Hi {name}. "
...     "You are a {profession}. "
...     "You were in {affiliation}."
... )
>>> message
'Hi Eric. You are a {profession}. You were in {affiliation}.'

如果你没有f在每行的前面都放一个,那么后面两个语句里的变量将不会被赋值。

如果你想将字符串分布在多行中,则还可以选择使用-转义字符 \

>>> message = f"Hi {name}. " \
...           f"You are a {profession}. " \
...           f"You were in {affiliation}."
...
>>> message
'Hi Eric. You are a comedian. You were in Monty Python.'

但是,如果使用以下方法,将会发生以下情况"""

>>> message = f"""
...     Hi {name}. 
...     You are a {profession}. 
...     You were in {affiliation}.
... """
...
>>> message
'\n    Hi Eric.\n    You are a comedian.\n    You were in Monty Python.\n'

阅读PEP 8中的缩进准则。

速度

f-Strings 比 %-formatting 和 str.format() 都要快。如你所见,f-Strings 是在运行时求值的表达式,而不是常量值。以下摘自文档:

“f-Strings 提供了一种使用最小语法在字符串文字中嵌入表达式的方法。应当注意,f-Strings 实际上是在运行时评估的表达式,而不是常数。在Python源代码中,f-Strings 是文字字符串,前缀为f,其中花括号内包含表达式。这些表达式将替换为其值。” (来源

在运行时,大括号内的表达式在其自己的范围内求值,然后与 f-Strings 的字符串文字部分放在一起。然后返回结果字符串。这就是全部。

这是速度比较:

>>> import timeit
>>> timeit.timeit("""name = "Eric"
... age = 74
... '%s is %s.' % (name, age)""", number = 10000)
0.003324444866599663
>>> timeit.timeit("""name = "Eric"
... age = 74
... '{} is {}.'.format(name, age)""", number = 10000)
0.004242089427570761
>>> timeit.timeit("""name = "Eric"
... age = 74
... f'{name} is {age}.'""", number = 10000)
0.0024820892040722242

如你所见,f-Strings 最快。

但是,情况并非总是如此。首次实施时,它们存在一些速度问题,需要使其速度比更快str.format()。引入了特殊的BUILD_STRING操作码

Python f-Strings:细节

既然你已经了解了为什么 f-Strings 很棒,我相信你一定要开始使用 f-Strings 。当你冒险进入这个勇敢的新世界时,请牢记以下一些细节。

引号

你可以在表达式内使用各种类型的引号。只要确保你没有在表达式中使用与 f-Strings 相同的引号即可。

该代码将起作用:

>>> f"{'Eric Idle'}"
'Eric Idle'

该代码也将起作用:

>>> f'{"Eric Idle"}'
'Eric Idle'

你还可以使用三引号:

>>> f"""Eric Idle"""
'Eric Idle'
>>> f'''Eric Idle'''
'Eric Idle'

如果发现需要在字符串的内部和外部使用相同类型的引号,则可以使用 \ 命令进行转义:

>>> f"The \"comedian\" is {name}, aged {age}."
'The "comedian" is Eric Idle, aged 74.'

字典

说到引号,使用字典时要当心。如果要对字典的键使用单引号,请记住确保对包含键的 f-Strings 使用双引号。

这将起作用:

>>> comedian = {'name': 'Eric Idle', 'age': 74}
>>> f"The comedian is {comedian['name']}, aged {comedian['age']}."
The comedian is Eric Idle, aged 74.

但这是一个语法错误的情况:

>>> comedian = {'name': 'Eric Idle', 'age': 74}
>>> f'The comedian is {comedian['name']}, aged {comedian['age']}.'
  File "<stdin>", line 1
    f'The comedian is {comedian['name']}, aged {comedian['age']}.'
                                    ^
SyntaxError: invalid syntax

如果在字典键周围使用与在f字符串外部相同的引号类型,则第一个字典键开头的引号将被解释为字符串的结尾。

大括号

为了使大括号出现在字符串中,必须使用双大括号:

>>> f"{{70 + 4}}"
'{70 + 4}'

请注意,使用三重花括号将导致字符串中只有一个大括号:

>>> f"{{{70 + 4}}}"
'{74}'

但是,如果使用的括号多于三个,则可以显示更多的括号:

>>> f"{{{{70 + 4}}}}"
'{{70 + 4}}'

反斜杠

如前所述,你可以在f-string的字符串部分使用反斜杠转义。但是,你不能在f-string的表达式部分使用反斜杠转义:

>>> f"{\"Eric Idle\"}"
  File "<stdin>", line 1
    f"{\"Eric Idle\"}"
                      ^
SyntaxError: f-string expression part cannot include a backslash

你可以通过预先计算表达式并在f字符串中使用结果来解决此问题:

>>> name = "Eric Idle"
>>> f"{name}"
'Eric Idle'

内部注释

表达式中不应包含使用该 # 符号的注释。下面代码,你会看到语法错误:

>>> f"Eric is {2 * 37 #Oh my!}."
  File "<stdin>", line 1
    f"Eric is {2 * 37 #Oh my!}."
                                ^
SyntaxError: f-string expression part cannot include '#'

版权声明:如无特殊说明,文章均为本站原创,版权所有,转载需注明本文链接

本文链接:http://www.bianchengvip.com/article/9/