# Программирование на Python

*Алла Тамбовцева, НИУ ВШЭ*

*Данный ноутбук частично основан на [лекции](http://python.math-hse.info:8080/github/ischurov/pythonhse/blob/master/Lecture%201.ipynb) Щурова И.В., [курс](http://math-info.hse.ru/s15/m) «Программирование на языке Python для сбора и анализа данных» (НИУ ВШЭ).*

## Вычисления и переменные в Python

### Python как калькулятор

Привычные арифметические действия (сложение, вычитание, умножение, деление) в Python выглядят так же, как во многих других языках или калькуляторах:

In [1]:
1 + 4

5

In [2]:
5 * 4 - 9

11

In [3]:
7 / 2

3.5

При делении Python всегда будет выдавать результат в виде числа с плавающей точкой (тип *float*), даже тогда, когда ожидается целочисленный ответ.

In [4]:
8 / 2  # не 4

4.0

Получился дробный результат, где дробная часть равна 0. Если нужен ответ в виде целого числа, можно воспользоваться целочисленным делением.

In [5]:
8 // 2  # теперь 4

4

Тут важно помнить, что при использовании оператора `//` дробная часть всегда будет просто отбрасываться – никакого округления происходить не будет. Для округления существуют специальные функции, и мы их обсудим позже.

In [6]:
7 // 2

3

В Python 2 обычное деление с помощью `/` было целочисленным. Для того чтобы получить привычные результаты деления, нужно было либо импортировать обычное деление из модуля `__future__`, который позволяет использовать функционал более новых версий Python  (см. [здесь](http://rextester.com/VMMS70343)), либо использовать другие хитрости, например, делить число с плавающей точкой на целое (см. [здесь](http://rextester.com/YJZV11974)).

>**Примечание:** для того, чтобы сравнивать исполнение одного и того же кода в Python 3 и Python 2 совсем необязательно устанавливать обе версии на компьютер. Можно воспользоваться онлайн-компиляторами (например,  http://rextester.com: выбирать Python или Python 3). Полноценно работать в них, не устанавливая Python, будет неудобно. Но для нескольких строк для сравнения как раз. Кроме того, создавать исполняемые файлы в разных версиях Python можно в среде PyCharm. Сейчас встретить код на Python 2 можно довольно редко, но вдруг! 

Если нам нужен остаток от деления, понадобится оператор `%`:

In [7]:
8 % 3

2

Что ещё можно делать с числами? Возводить в степень и извлекать из них корень. При расчётах на калькуляторе и в некоторых языках для возведения числа в степень иногда используется оператор `^`. Попробуем! 

In [8]:
5 ^ 2

7

Получилось что-то неожиданное. В Python оператор `^` используется для операции «исключающее или», которая при применении к двум целым числам соответствует побитному сложению по модулю два. Другими словами, Python переводит оба числа в двоичный формат, применяет к полученным последовательностям из 0 и 1 логическую операцию «исключающее или» (XOR) и полученный результат преобразует в число в десятичной системе счисления.

Для возведения числа в степень потребуется оператор `**`:  

In [9]:
5 ** 2

25

In [10]:
6 ** (1/3)  # дробная степень - корень 3 степени

1.8171205928321397

Теперь попробуем извлечь квадратный корень из числа с помощью довольно привычной функции `sqrt()`.

In [11]:
sqrt(9)  # не получается!

NameError: name 'sqrt' is not defined

Python пишет, что не знает, что такое `sqrt`. В каких случаях Python может такое писать? Например, если мы опечатались в названии функции (Python не понимает, что мы от него хотим) или если мы пытаемся обратиться к функции, которая не входит в стандартную библиотеку (Python не знает, откуда её брать). В данном случае мы столкнулись со второй проблемой. Функция для вычисления квадратного корня из числа хранится в специальном модуле `math`. Этот модуль стандартный, дополнительно устанавливать его не нужно. Но для того чтобы воспользоваться этой функцией, нужно сначала импортировать модуль, а потом вызвать из него функцию `sqrt`.

In [12]:
import math

In [13]:
math.sqrt(9)

3.0

Если из `math` нам нужна только одна функция `sqrt` , можно извлечь только её, и тогда прописывать название модуля перед функцией не понадобится: 

In [14]:
from math import sqrt
sqrt(16)

4.0

С помощью конструкции `from ... import` можно импортировать сразу несколько функций:

In [15]:
from math import sqrt, exp

In [16]:
exp(3)

20.085536923187668

Иногда, если неизвестно, сколько функций потребуется, но каждый раз прописывать полностью название модуля не хочется, можно импортировать его сразу с сокращённым названием. Сделать это можно с помощью конструкции `import ... as ...`.

In [17]:
import math as ma
ma.sqrt(9)

3.0

>**Примечание:** то же будет верно и для библиотек. Пока мы столкнулись с модулем `math`, в темах по обработке данных мы будем активно работать с разными библиотеками. Если совсем упростить, модуль – это набор функций, а библиотека – это набор модулей, то есть что-то более сложное по структуре и более насыщенное по функционалу.

Если мы знаем, что будем использовать практически все функции из модуля `math`, их можно извлечь все сразу, с помощью конструкции `from ... import *`, и тогда прописывать название библиотеки нам не понадобится нигде. 

In [18]:
from math import *

Однако в общем случае так делать нежелательно, потому что это нерационально и увеличивает время исполнения кода (Python загружает все функции, а мы пользуемся только некоторыми).

В `math` есть много полезных функций для вычислений. Чтобы посмотреть, какие функции там есть, после импортирования всего модуля через `import math` можно набрать `math.` и нажать на *Tab* (актуально при работе в интерактивных средах). Посмотрим на некоторые из них:

In [19]:
math.log(2)  # натуральный логарифм

0.6931471805599453

In [20]:
math.log10(100)  # логарифм по основанию 10

2.0

In [21]:
math.sin(0)  # синус

0.0

In [22]:
math.ceil(8.7)  # ceil - потолок, округление в большую сторону

9

In [23]:
math.floor(8.7)  # floor - пол, округление в меньшую сторону

8

А ещё из `math` можно импортировать константы $\pi$ и $e$:

In [24]:
from math import pi, e

In [25]:
pi

3.141592653589793

In [26]:
e

2.718281828459045

С чем ещё можно столкнуться, выполняя вычисления в Python? С такими вещами:

In [27]:
1 / 18 ** 25

4.1513310942010236e-32

Результат выше – компьютерная форма экспоненциальной записи числа. Здесь `e-32` – это $10^{-32}$, а вся запись означает $4.1513310942010236 \cdot 10^{-32}$, то есть примерно $4.15 \cdot 10^{-32}$. Теоретически, если число было очень большим, `e` стояло бы в положительной степени. Но в Python такое не случается, обычно он выводит огромные числа, просто переходя на новую строку, если места на одной не хватает:

In [28]:
23 ** 990

1289904795722524852300664653946433572197941130104134088478189930383101076502744219639659417064279093437500724657867718280363659016416181923552335933421079599787731352623013818688037376821636356298471193060683439063568388956706601750163828629545445022359292138002524361265592997289185467008900595878230131374891925740927099907644385574371712931640134380964875519021338743237009960351798990591785901330234187832132594157031508869823418944411036223721421784688413593595239909735242752185287762072502162693811343723284822605812833452885992267779219869756802170805925667519108800646706974810901481745137595259834979091153560765179649358449388942743557094050235977330162288125989098383992641123256017473945558974138807380552944666746150516911066016176584327355762384321949080570879109260247597464891633632925375455033171650232736541688999821214785702033094236827743042780438506654627194341368995082202093140059324504630375861097394388223559274979429315506000963668011991635894787947288278280887007622963549

Компьютерная форма записи числа отчасти помогает понять, почему дробные числа называются числами с плавающей точкой (тип *float*). Возьмем число попроще, например, $12.34$. Его можно записать как $12.34$, как $1.234 \cdot 10$, как $123.4 \cdot 10^{-1}$, $1234 \cdot 10^{-2}$ и так далее. Точка, отделяющая дробную часть от целой, будет «плавать», однако само число при этом меняться не будет, будут меняться только множители – разные степени десятки.

С числами с плавающей точкой связана ещё одна сложность — округление. На первый взгляд, всё хорошо:

In [29]:
round(12.6)  # округлим до целого - по умолчанию

13

In [30]:
round(12.53, 1)  # округлим до первого знака после запятой

12.5

С другой стороны, могут возникнуть странности: 

In [31]:
round(2.50)  # не 3

2

In [32]:
round(3.525, 2)  # не 3.53

3.52

Эти странности связаны с тем, что число, которое мы видим, не совпадает с тем, которое хранится в компьютере (так называемая «проблема представления», возникающая из-за конфликта Python и архитектуры системы при преобразовании чисел из десятичной системы в двоичную и обратно). Чтобы понять, как Python видит число 3.525 при обработке, обратимся к модулю `decimal`:

In [33]:
from decimal import Decimal
Decimal(3.525)

Decimal('3.524999999999999911182158029987476766109466552734375')

Такое число будет законно округляться до 3.52 по правилам арифметического округления. 

С одной стороны, полезно помнить, что числа с плавающей точкой (тип *float*) не рекомендуется использовать в финансовых вычислениях и вообще в вычислениях, требующих высокой точности, поскольку они «накапливают ошибку», то есть могут давать неточные результаты. С другой стороны, важно понимать, что эта проблема решаема. Вместо того чтобы использовать дробные числа в виде чисел с плаващей точкой «как есть», можно вопользоваться тем же модулем `decimal` или модулем `fractions`, если речь идёт об обычных дробях.

### Переменные

Python, в отличие от многих низкоуровневых языков программирования (C, C++, Java) – язык с динамической типизацией, он сам распознаёт, что мы сохраняем в переменную: число, целое число, текст, список чисел... Поэтому при создании переменной нам не нужно указывать её тип.

In [34]:
# Python поймет, что это целые числа

x = 2
y = 3

In [35]:
print(x)
print(y)

2
3


Значения переменных мы можем обновлять – изменить значение и сохранить в переменную с тем же названием. 

In [36]:
x = x + 1
print(x)

3


In [37]:
y = y * 2
print(y)

6


>**Примечание:** в Python также можно использовать операторы для инкремента и декремента: `x += 1` вместо обычного `x = x + 1`, `x -= 1` вместо `x = x - 1`, или `y *= 2` вместо `y = y * 2`. 

В Python реализуется принцип сбора мусора – объекты, которые не используются, удаляются, тем самым, освобождается место в памяти. Разберём такой пример: сначала в переменную `x` мы сохраним число 5, а потом – текст "abc":

In [38]:
x = 5
x = "abc"

Для Python эти операции выглядят так. Есть объект 5, это целое число, для которого резервируется некоторая ячейка памяти. Мы создаём переменную `x`, создавая при этом ссылку, которая соединяет название `x` и объект 5. Когда мы присваиваем `x` значение `"abc"`, мы помещаем в некоторую ячейку памяти строковый объект "abc" и перенаправляем ссылку с названием `x` на эту ячейку. При этом значение 5, если оно больше нигде не используется, удаляется с целью экономии памяти.

Названия переменных в Python могут быть почти любыми. Три общих правила: название переменной не должно начинаться с цифры, в названии не должно быть пробелов, название не должно совпадать со служебными (зарезервированными) словами в Python. Список зарезервированных слов можно узнать так:

In [39]:
import keyword
print(keyword.kwlist)

['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


Обычно рекомендуется давать переменным осмысленные названия: если речь идёт о доходе, называть переменную не `x`, а `income`, если речь идёт о данных по преступности, сохранять таблицу в переменную `crimes`, и так далее. Технически, Python 3 допускает названия на кириллице, но это будет выглядеть странно и неуместно.

У Python есть интересная особенность – возможность присваивать значения нескольким переменным одновременно, множественное присваивание (*multiple assignment*). Например, мы можем следующим образом записать сразу значения двух переменных `a` и `b`:

In [40]:
a, b = 0, 1
print(a)
print(b)

0
1


Это возможно, за счёт того, что если Python сталкивается с перечнем элементов через запятую, он объединяет их в структуру данных – кортеж:

In [41]:
0, 1

(0, 1)

Поэтому при присваивании он понимает, что первый элемент кортежа нужно записать в `a`, в второй – в `b`. Что интересно, множественное присваивание позволяет менять значения переменных местами:

In [42]:
a = 2
b = 5
a, b = b, a
print(a, b)

5 2
