Как открыть jupiter notebook в анаконде
Начало работы с Anaconda
Дистрибутив Anaconda включает conda и Anaconda Navigator, а также Python и сотни пакетов, используемых в научных вычислениях. При установке Anaconda все эти элементы также устанавливаются.
Conda работает в командной строке так же, как Anaconda Prompt в Windows и терминал в macOS и Linux.
Navigator — это настольная программа с пользовательским интерфейсом, с помощью которой можно запускать приложения и легко управлять пакетами conda, средами и каналами, не прибегая к командам командной строки.
Можете попробовать conda и Navigator, чтобы решить, что лучше подходит именно вам для управления пакетами и средами. Между ними даже можно переключаться — результат работы из одной программы будет виден во второй.
Выполните простые упражнения в Navigator и командной строке, чтобы решить, что подходит больше.
Первая программа на Python: Hello, Anaconda!
Используйте Anaconda Navigator для запуска приложения. Затем создайте и запустите простую программу на Python с помощью Spyder и Jupyter Notebook.
Откройте Navigator
Windows
Откройте приложение Anaconda Navigator в меню Пуск.
macOS
Откройте Launchpad и кликните по иконке Anaconda Navigator.
Linux
Запустите Python в Spyder IDE
Главный экран Navigator показывает приложения, которые можно запустить.
Если Spyder уже установлен, переходите к следующему пункту.
Закройте Spyder
В меню выберите «Spyder — Закрыть Spyder» (на macOS: «Python — Закрыть Spyder»).
Запустите Python в Jupyter Notebook
Если Jupyter Notebook уже установлен, переходите к следующему пункту.
Закройте Jupyter Notebook
Закройте Navigator
В меню выберите Anaconda Navigator — Закрыть Anaconda-Navigator
Напишите программу на Python с помощью Anaconda Prompt или терминала
Откройте Anaconda Prompt
Windows
В меню Пуск найдите и откройте Anaconda Prompt
macOS
Откройте Launchpad и кликните на окно терминала
Linux
Откройте окно терминала
Запустите Python
В Anaconda Prompt (терминале — в Linux или macOS) введите python и нажмите Enter.
>>> в начале строки значит, что Python запущен.
Напишите программу на Python
Введите print(«Hello Anaconda!») и нажмите Enter.
После нажатия программа запустится. На экран выведется «Hello Anaconda!». Вы официально начали программировать на Python!
Выйдите из Python
На Windows используйте сочетание CTRL-Z и нажмите Enter. На macOS или Linux введите exit() и нажмите Enter.
По желанию: запустите Spyder или Jupyter Notebook из командной строки.
Jupyter Notebook должен запуститься так же, как это было при использовании Anaconda Navigator. Закройте его по тому же принципу.
How to use Jupyter notebooks in a conda environment?
Typically one runs jupyter notebook or jupyter-notebook or ipython notebook in a terminal to start a Jupyter notebook webserver locally (and open the URL in the browser). When using conda and conda environments, what is the best way to run a Jupyter notebook which allows to import Python modules installed in the conda environment?
This question has been asked many times, but there is no good place to answer it, most Q&A’s and Github tickets are quite messy so let’s start a new Q&A here.
1 Answer 1
*Disclaimer: tested only in Ubuntu and Windows (see comments to this answer), please comment if something is changes when using a different OS.
Jupyter runs the user’s code in a separate process called kernel. The kernel can be a different Python installation (in a different conda environment or virtualenv or Python 2 instead of Python 3) or even an interpreter for a different language (e.g. Julia or R). Kernels are configured by specifying the interpreter and a name and some other parameters (see Jupyter documentation) and configuration can be stored system-wide, for the active environment (or virtualenv) or per user. If nb_conda_kernels is used, additional to statically configured kernels, a separate kernel for each conda environment with ipykernel installed will be available in Jupyter notebooks.
In short, there are three options how to use a conda environment and Jupyter:
Option 1: Run Jupyter server and kernel inside the conda environment
Jupyter will be completely installed in the conda environment. Different versions of Jupyter can be used for different conda environments, but this option might be a bit of overkill. It is enough to include the kernel in the environment, which is the component wrapping Python which runs the code. The rest of Jupyter notebook can be considered as editor or viewer and it is not necessary to install this separately for every environment and include it in every env.yml file. Therefore one of the next two options might be preferable, but this one is the simplest one and definitely fine.
Option 2: Create special kernel for the conda environment
Then run jupyter from the system installation or a different conda environment:
Name of the kernel and the conda environment are independent from each other, but it might make sense to use a similar name.
Option 3: Use nb_conda_kernels to use a kernel in the conda environment
Troubleshooting
Using Linux/Mac the command which on the command line will tell you which jupyter is used, if you are using option 1 (running Jupyter from inside the conda environment), it should be an executable from your conda environment:
Inside the notebook you should see that Python uses Python paths from the conda environment:
Jupyter provides the command jupyter-troubleshoot or in a Jupyter notebook:
This will print a lot of helpful information about including the outputs mentioned above as well as installed libraries and others. When asking for help regarding Jupyter installations questions, it might be good idea to provide this information in bug reports or questions.
To list all configured Jupyter kernels run:
Common errors and traps
Jupyter notebook not installed in conda environment
Note: symptoms are not unique to the issue described here.
Symptoms: ImportError in Jupyter notebooks for modules installed in the conda environment (but not installed system wide), but no error when importing in a Python terminal
Explaination: You tried to run jupyter notebook from inside your conda environment (option 1, see above), there is no configuration for a kernel for this conda environment (this would be option 2) and nb_conda_kernels is not installed (option 3), but jupyter notebook is not (fully) installed in the conda environment, even if which jupyter might make you believe it was.
In GNU/Linux you can type which jupyter to check which executable of Jupyter is run.
This means that system’s Jupyter is used, probably because Jupyter is not installed:
If the path points to a file in your conda environment, Jupyter is run from inside Jupyter:
Solution: Install jupyter notebook inside the conda environment:
Wrong kernel configuration: Kernel is configured to use system Python
Note: symptoms are not unique to the issue described here.
Symptoms: ImportError in Jupyter notebooks for modules installed in the conda environment (but not installed system wide), but no error when importing in a Python terminal
A user kernel specification in
/.local/share/jupyter/kernels/python3/kernel.json might override the system-wide and environment kernel. If the environment kernel is missing or the user kernel points to a python installation outside the environment option 1 (installation of jupyter in the environment) will fail.
For occurrences and discussions of this problem and variants see here, here, here and also here, here and here.
Solution: Use jupyter kernelspec list to list the location active kernel locations.
Correct conda environment not activated
Symptoms: ImportError for modules installed in the conda environment (but not installed system wide) in Jupyter notebooks and Python terminals
Solution: Activate conda environment before running Jupyter.
Broken kernel configuration
Symptoms: Strange things happening. Maybe similar symptoms as above, e.g. ImportError
Explanation: If you attempted to use option 2, i.e. running Jupyter from system and the Jupyter kernel inside the conda environment by using an explicit configuration for the kernel, but it does not behave as you expect, the configuration might be corrupted in some way.
Solution: Check configuration in
Python 2 vs 3
Explanation: The kernel configuration can have all sorts of confusing and misleading effects. For example the default Python 3 kernel configuration will allow me to launch a Jupyter notebook running on Python 2:
The default Python 3 kernel:
After creating a new Jupyter Notebook with the Python 3 kernel, Python 2 from the conda environment will be used even if «Python 3» is displayed by Jupyter.
Установка, запуск и подключение к Jupyter Notebook на удаленном сервере
Published on January 7, 2020
Введение
Jupyter Notebook — интерактивное веб-приложение с открытым исходным кодом, позвоялющее писать и запускать программный код более чем на 40 языках программирования, включая Python, R, Julia и Scala. Jupyter Notebook — это продукт Project Jupyter, очень полезный для итеративного программирования, поскольку он позволяет написать небольшой фрагмент кода, запустить его и вывести результат.
Jupyter Notebook позволяет создавать документы в форме блокнота, обычно называемые «блокнотами». Блокноты, создаваемые Jupyter Notebook, представляют собой доступные для публикации и воспроизведения исследовательские документы, содержащие элементы расширенного текста, уравнения, код и результаты исполнения (рисунки, таблицы, интерактивные графики). Блокноты можно экспортировать в файлы кода, документы HTML или PDF, а также использовать для создания интерактивных слайд-шоу или веб-страниц.
Эта статья расскажет вам о том, как установить и настроить приложение Jupyter Notebook на веб-сервере Ubuntu 18.04 и подключиться к нему с локального компьютера. Также мы покажем, как использовать Jupyter Notebook для запуска примера кода на Python.
Предварительные требования
Для данного обучающего руководства вам потребуется следующее:
Кроме того, если на вашем локальном компьютере используется Windows, вам нужно будет установить PuTTY для создания туннеля SSH для подключения к серверу. Для загрузки и установки PuTTY следуйте указаниям обучающего модуля Создание ключей SSH с помощью PuTTY в Windows.
Шаг 1 — Установка Jupyter Notebook
Поскольку блокноты используются для записи, запуска и просмотра результатов выполнения небольших фрагментов программного кода, предварительно нужно настроить поддержку языка программирования. Jupyter Notebook использует ядро с привязкой к языкам, компьютерную программу, которая запускает и проводит внутренний анализ кода. В Jupyter Notebook имеется много ядер для разных языков, по умолчанию используется IPython. В этом обучающем модуле вы научитесь настраивать Jupyter Notebook для запуска кода Python через ядро IPython.
Начнем с активации виртуальной среды:
После этого в вашей командной строке будет отображаться имя вашей среды в качестве префикса.
Теперь вы находитесь в виртуальной среде и можете начать установку Jupyter Notebook:
Если установка выполнена успешна, вы увидите примерно следующий результат:
Установка Jupyter Notebook на ваш сервер завершена. Теперь мы перейдем к запуску приложения.
Шаг 2 — Запуск Jupyter Notebook
Jupyter Notebook необходимо запускать с VPS, чтобы вы могли подключаться к нему с локального компьютера, используя туннель SSH и свой любимый браузер.
Чтобы запустить сервер Jupyter Notebook, введите следующую команду:
После запуска команды вы увидите примерно следующий результат:
Затем выйдите из сервера, используя команду exit :
Вы только что запустили Jupyter Notebook на своем сервере. Чтобы получить доступ к приложению и начать работать с блокнотами, вам потребуется подключиться к приложению через туннель SSH и браузер на локальном компьютере.
Шаг 3 — Подключение к приложению Jupyter Notebook через туннель SSH
Туннель SSH — простой и быстрый способ подключиться к приложению Jupyter Notebook, запущенному на вашем сервере. Secure Shell (обычно SSH) — это сетевой протокол, позволяющий выполнить защищенное подключение к удаленному серверу по незащищенной сети.
Протокол SSH включает механизм переадресации портов, позволяющий подключаться через туннель к определенным приложениям на определенном порту сервера с определенного порта на локальном компьютере. Мы научимся выполнять безопасную «переадресацию» приложения Jupyter Notebook на вашем сервере (по умолчанию использует порт 8888 ) на порт вашего локального компьютера.
Предпочтительный метод создания туннеля SSH зависит от операционной системы вашего локального компьютера. Выберите ниже подраздел, больше всего подходящий для вашего компьютера.
Примечание. Приложение Jupyter Notebook можно установить через веб-консоль DigitalOcean, однако подключение к приложению через туннель SSH следует выполнять с помощью терминала или PuTTY.
Создание туннелей SSH в macOS или Linux
Если на вашем локальном компьютере используется Linux или macOS, туннель SSH можно создать, запустив всего одну команду.
Если эта команда не выдаст никаких ошибок, вы войдете на удаленный сервер. Там вы должны активировать виртуальную среду:
Затем запустите приложение Jupyter Notebook:
Создание туннелей SSH с использованием Windows и PuTTY
PuTTY — клиент SSH с открытым исходным кодом для Windows, который можно использовать для подключения к вашему серверу. После загрузки и установки PuTTY на ваш компьютер Windows (как описано в обучающем модуле из предварительных требований) откройте программу и введите URL или IP-адрес вашего сервера, как показано здесь:
Затем нажмите кнопку Open (Открыть). Ваш компьютер подключится к серверу через SSH и соединит желаемые порты туннелем. Если никаких ошибок не появится, вы можете активировать свою виртуальную среду:
Затем запустите Jupyter Notebook:
Затем откройте в предпочитаемом браузере локальный порт, например http://localhost: 8000 (или любой выбранный номер порта), чтобы подключиться к экземпляру Jupyter Notebook, запущенному на сервере. После подключения к Jupyter Notebook переходите к шагу 4, чтобы научиться его использовать.
Шаг 4 — Использование Jupyter Notebook
К этому моменту вы должны были подключиться к серверу через туннель SSH и запустить на сервере приложение Jupyter Notebook. После перехода на адрес http://localhost: 8000 вы увидите страницу входа в систему:
В поле Password (Пароль) или поле токена сверху введите токен, показываемый в результатах после запуска jupyter notebook на сервере:
Также вы можете скопировать URL с экрана терминала и вставить его в адресную строку браузера.
Jupyter Notebook автоматически покажет все файлы и папки, хранящиеся в каталоге, откуда выполняется запуск. Создайте новый файл блокнота, нажав New (Создать) и выбрав Python 3 в правом верхнем углу информационной панели Notebook:
В новом блокноте измените первую ячейку так, чтобы она принимала синтаксис разметки. Для этого нажмите Cell > Cell Type > Markdown (Ячейка > Тип ячейки > Разметка) на панели навигации сверху. Помимо разметки этот тип ячейки также позволяет записывать уравнения в LaTeX. Например, введите в ячейку следующее после ее переключения на разметку:
Вы можете использовать ячейки разметки для заметок и документирования программного кода.
Теперь выполним простое уравнение и распечатаем результат. Нажмите Insert > Insert Cell Below (Вставка > Вставить ячейку снизу), чтобы вставить ячейку. Введите в новую ячейку следующий код:
Для запуска кода нажмите CTRL + ENTER и получите следующий результат:
Это довольно простые примеры того, что можно сделать с Jupyter Notebook. Однако это очень мощное приложение, которое можно использовать для самых разных целей. Отсюда вы можете добавить некоторые библиотеки Python и использовать блокнот, как и в любой другой среде разработки Python.
Заключение
Теперь вы можете писать воспроизводимый код Python и текст, используя приложение Jupyter Notebook на удаленном сервере. Чтобы пройти быстрый обзор Jupyter Notebook, нажмите Help (Справка) в верхней панели навигации и выберите пункт User Interface Tour (Обзор пользовательского интерфейса), как показано здесь:
Если вы заинтересовались, вы можете узнать больше о Jupyter Notebook из документации Project Jupyter. Также вы можете использовать полученные в этом обучающем модуле знания, чтобы научиться программировать на Python 3.
Using Jupyter Notebook extensionsВ¶
With Anaconda you can download and install 4 extensions for the Jupyter Notebook which make the notebook easier to use:
Installing any of the 4 installs all of them. The _nb_ext_conf package is also installed, which activates the extensions.
Obtaining the extensionsВ¶
To get the extensions using Anaconda Navigator:
To install all Jupyter Notebook extensions from the command line, run:
These extensions were already installed in Anaconda versions 4.1 and 4.2. If you have Anaconda v4.1 or v4.2 installed, there is no need to install them separately. To begin using them, open a new or existing notebook.
Uninstalling the extensionsВ¶
To remove all Jupyter Notebook extensions, run:
Uninstalling nb_conda or any other 1 of the 4 extensions uninstalls all 4.
To disable Jupyter Notebook extensions individually without uninstalling them, run:
Replace with your root environment or another conda environment where the extensions have been installed.
RISEВ¶
You can access the install instructions for the RISE extension from anaconda.org.
In-depth documentation can be found there as well.
Notebook anaconda.orgВ¶
You must have an anaconda.org account for this extension to work. You can sign up for a free account at anaconda.org.
You can upload your notebook to your Cloud account with a simple button push:
You can use the Attach conda environment option described below to embed a copy of your conda environment as an environment.yaml file in the notebook metadata.
If you are not signed in to Cloud, a dialog box appears asking for your Cloud username and password.
You may instead log in at the command line:
This is recommended if you do not have a secure connection.
Open Jupyter Notebook, then open the notebook you wish to upload to Cloud.
In the top navigation bar, click the Publish to anaconda.org button:
In the dialog box that appears, select your username.
Type a description of the notebook for display on Cloud:
If you want the identical environment to be included when the notebook is downloaded and opened, select the Attach conda environment checkbox.
Click the Publish button.
After publishing, you can view the notebook or play the presentation on Cloud from the top navigation bar by clicking the Cloud button:
Your notebook on anaconda.org will look similar to this one:
Notebook condaВ¶
This extension provides conda environment and package access from within Jupyter Notebook.
To manage all environments:
While viewing the dashboard file manager, select the Conda tab, which shows your current conda environments:
To add a new conda environment, click the + button above the environments list on the right side.
Select an environment by clicking its name.
In the package management section that displays, the icons from left to right have the following meanings:
To manage the current kernel environment, in the Kernel menu, select Conda Packages, which displays a list of conda packages in the current environment:
For more information on using and managing conda packages, see Managing packages.
Notebook Conda KernelsВ¶
This extension allows you to use conda environment-based kernels from the dashboard and the notebook’s Kernel menu. It makes the notebook aware of your conda environments, and it is required for Notebook anaconda.org and Notebook Conda.
When creating a new notebook on the Files tab, you can pick any of the Python or R language kernels in any of your environments:
You can also change to those kernels on a current notebook:
Jupyter Notebook для начинающих: учебник
Дата публикации May 9, 2018
Чтобы получить максимальную отдачу от этого урока, вы должны быть знакомы с программированием, особенно с Python ипандв частности. Тем не менее, если у вас есть опыт работы с другим языком, Python в этой статье не должен быть слишком загадочным, а панды должны быть интерпретируемыми. Ноутбуки Jupyter также могут выступать в качестве гибкой платформы для работы с пандами и даже с Python, как станет ясно из этой статьи.
Пример анализа данных в блокноте Jupyter
Мы рассмотрим пример анализа, чтобы ответить на реальный вопрос, чтобы вы могли увидеть, как поток записной книжки делает задачу интуитивно понятной для работы через себя, а также для других, чтобы понять, когда мы поделимся ею с ними.
Итак, допустим, вы аналитик данных, и вам было поручено выяснить, как исторически менялась прибыль крупнейших компаний в США. Вы найдете набор данных о компаниях из списка Fortune 500, охватывающих более 50 лет с момента первой публикации списка в 1955 году, собранных изПубличный архив Фортуны, Мы продвинулись вперед и создали CSV данных, которые вы можете использоватьВот,
Как мы покажем, ноутбуки Jupyter идеально подходят для этого исследования. Во-первых, давайте продолжим и установим Jupyter.
Установка
Чтобы получить Анаконду, просто:
Если вы более продвинутый пользователь с уже установленным Python и предпочитаете управлять своими пакетами вручную, вы можете просто использовать pip:
Создание вашего первого блокнота
В этом разделе мы рассмотрим, как запускать и сохранять записные книжки, знакомиться с их структурой и понимать интерфейс. Мы познакомимся с некоторыми основными терминами, которые приведут вас к практическому пониманию того, как самостоятельно использовать ноутбуки Jupyter, и подготовим нас к следующему разделу, в котором описан пример анализа данных и реализовано все, что мы здесь изучаем.
Бегущий Юпитер
В Windows вы можете запустить Jupyter с помощью ярлыка, который Anaconda добавляет в ваше меню «Пуск», которое откроет новую вкладку в вашем веб-браузере по умолчанию, которая должна выглядеть примерно так, как показано на следующем скриншоте.
Это пока не блокнот, но не паникуйте! Там не так много для этого. Это панель инструментов ноутбука, специально разработанная для управления ноутбуками Jupyter. Думайте об этом как о панели запуска для изучения, редактирования и создания ваших ноутбуков.
Имейте в виду, что панель управления предоставит вам доступ только к файлам и подпапкам, содержащимся в каталоге запуска Jupyter; Тем не менее, каталог запускаможет быть изменено, Также можно запустить панель мониторинга в любой системе через командную строку (или терминал в системах Unix), введя команду jupyter notebook ; в этом случае текущим рабочим каталогом будет каталог запуска.
Интерфейс панели управления в основном не требует пояснений, хотя мы вернемся к нему позже. Так чего же мы ждем? Перейдите в папку, в которой вы хотите создать свой первый блокнот, нажмите кнопку «Создать» в правом верхнем углу и выберите «Python 3» (или выбранную вами версию).
Что такое файл ipynb?
Вы также можете просмотреть содержимое файлов вашей записной книжки, выбрав «Редактировать» на панели управления, но ключевое слово здесь «может«; нет никакой другой причины, кроме любопытства, сделать это, если вы действительно не знаете, что делаете.
Интерфейс ноутбука
Вы должны заметить два довольно важных термина, которые, вероятно, являются новыми для вас:ячейкиа такжеядраявляются ключом как к пониманию Jupyter, так и к тому, что делает его не просто текстовым процессором. К счастью, эти понятия не сложно понять.
ячейки
Мы вернемся к ядрам чуть позже, но сначала давайте разберемся с клетками. Клетки образуют корпус ноутбука. На скриншоте новой записной книжки в приведенном выше разделе это поле с зеленым контуром является пустой ячейкой. Есть два основных типа ячеек, которые мы рассмотрим:
Результат должен выглядеть так:
В строке меню нажмитеВставитьи выберитеВставьте ячейку нижесоздать новую ячейку кода под вашей первой и попробуйте следующий код, чтобы увидеть, что происходит. Вы замечаете что-то другое?
Как правило, выходные данные ячейки поступают из любых текстовых данных, специально напечатанных во время выполнения ячеек, а также из значения последней строки в ячейке, будь то переменная-одиночка, вызов функции или что-то еще. Например:
Вы обнаружите, что почти постоянно используете это в своих собственных проектах, и мы увидим больше этого позже
Горячие клавиши
Ниже вы найдете список некоторых сочетаний клавиш Jupyter. От вас не ожидают, что вы сразу же их заберете, но список должен дать вам хорошее представление о том, что возможно.
Однажды в командном режиме:
С несколькими выбранными ячейками:
Иди и попробуй это в своей записной книжке. После того, как вы сыграете, создайте новую ячейку Markdown, и мы научимся форматировать текст в наших блокнотах.
уценка
уценкаэто легкий, легкий для изучения язык разметки для форматирования простого текста. Его синтаксис имеет однозначное соответствие с тегами HTML, поэтому некоторые предварительные знания здесь могут быть полезны, но это определенно не является обязательным условием. Помните, что эта статья была написана в блокноте Jupyter, поэтому весь повествовательный текст и изображения, которые вы видели до сих пор, были выполнены в Markdown. Давайте рассмотрим основы с кратким примером.
При прикреплении изображений у вас есть три варианта:
У Markdown гораздо больше деталей, особенно в отношении гиперссылок, а также возможно просто включить простой HTML. Как только вы обнаружите, что раздвигаете границы описанных выше основ, вы можете обратиться кофициальный гидот создателя, Джона Грубера, на его сайте.
Например, если вы импортируете библиотеки или объявляете переменные в одной ячейке, они будут доступны в другой. Таким образом, вы можете думать о документе блокнота как о чем-то сравнимом с файлом сценария, за исключением того, что он является мультимедийным. Давайте попробуем это, чтобы почувствовать это. Сначала мы импортируем пакет Python и определим функцию.
Как только мы выполнили ячейку выше, мы можем ссылаться np а также square в любой другой камере.
Это будет работать независимо от порядка ячеек в вашем блокноте. Вы можете попробовать сами, давайте снова распечатаем наши переменные.
Если ваше ядро застряло в вычислении, и вы хотите остановить его, вы можете выбрать опцию Interupt.
Выбор кернала
Возможно, вы заметили, что Jupyter дает вам возможность сменить ядро, и на самом деле есть много разных вариантов на выбор. Назад, когда вы создали новую записную книжку из панели инструментов, выбрав версию Python, вы фактически выбирали, какое ядро использовать
Существуют не только ядра для разных версий Python, но и дляболее 100 языковв том числе Java, C и даже Fortran. Исследователи данных могут быть особенно заинтересованы в ядрах дляра такжеЮлия, а также обаimatlabиCalysto MATLAB Kernelдля Matlab.Ядро SoSобеспечивает многоязычную поддержку в одной записной книжке. Каждое ядро имеет свои собственные инструкции по установке, но, вероятно, потребует от вас выполнения некоторых команд на вашем компьютере.
Пример анализа
Стоит отметить, что каждый разработает свои собственные предпочтения и стиль, но общие принципы по-прежнему применяются, и вы можете следовать этому разделу в своем блокноте, если хотите, что дает вам возможность поиграть.
Называя ваши ноутбуки
Затем вы можете выбрать свой блокнот и нажать «Переименовать» на панели управления.
Как только вы назвали свою записную книжку, откройте ее снова, и мы начнем.
Настроить
Обычно начинают с ячейки кода специально для импорта и настройки, поэтому, если вы решите добавить или изменить что-либо, вы можете просто отредактировать и повторно запустить ячейку, не вызывая побочных эффектов.
Мы импортируемпандработать с нашими данными,Matplotlibстроить графики ирожденное моречтобы сделать наши графики красивее. Также распространено импортироватьNumPyно в этом случае, хотя мы используем его через панд, нам не нужно явно. И эта первая строка не является командой Python, но использует нечто, называемое магией строк, для инструктирования Jupyter захватывать графики Matplotlib и отображать их в выходных данных ячейки; это одна из ряда расширенных функций, которые выходят за рамки данной статьи.
Давайте продолжим и загрузим наши данные.
Также целесообразно делать это в одной ячейке на случай, если нам понадобится перезагрузить ее в любой момент.
Сохранить и контрольная точка
Теперь, когда мы начали, лучше регулярно экономить. прессование Ctrl + S сохранит вашу записную книжку, вызвав команду «Сохранить и проверить», но что это за контрольная точка?
Изучение нашего набора данных
Теперь мы действительно катимся! Наш блокнот благополучно сохранен, и мы загрузили наш набор данных df в наиболее часто используемую структуру данных панд, которая называется DataFrame и в основном выглядит как стол. Как выглядит наш?
Хорошо выглядеть. У нас есть столбцы, которые нам нужны, и каждая строка соответствует одной компании за один год.
Давайте просто переименуем эти столбцы, чтобы мы могли обратиться к ним позже.
Далее нам нужно изучить наш набор данных. Это завершено? Панды читали это как ожидалось? Отсутствуют ли какие-либо значения?
Давайте проверим, был ли наш набор данных импортирован, как мы ожидали. Простая проверка состоит в том, чтобы видеть, были ли типы данных (или dtypes) правильно интерпретированы.
Как мы и подозревали! Некоторые значения являются строками, которые использовались для указания отсутствующих данных. Есть ли какие-то другие ценности, которые закрались?
Это облегчает интерпретацию, но что нам делать? Ну, это зависит от того, сколько значений пропущено.
На первый взгляд, мы видим, что самые недопустимые значения за один год составляют менее 25, а поскольку существует 500 точек данных в год, удаление этих значений будет составлять менее 4% данных для худших лет. Действительно, кроме всплеска около 90-х годов, большинство лет имеют менее половины недостающих значений пика. Для наших целей допустим, что это приемлемо, и удалите эти строки.
Мы должны проверить, что сработало.
Большой! Мы завершили настройку набора данных.
Если бы вы собирались представить свою записную книжку в виде отчета, вы могли бы избавиться от созданных нами исследовательских ячеек, которые включены здесь в качестве демонстрации процесса работы с записными книжками, и объединить соответствующие ячейки (см. Раздел «Дополнительные функции» ниже для подробнее об этом) для создания единой ячейки настройки набора данных. Это будет означать, что если мы когда-нибудь испортим наш набор данных в другом месте, мы можем просто повторно запустить ячейку настройки, чтобы восстановить ее.
Черчение с матплотлибом
Далее мы можем перейти к решению данного вопроса, построив график средней прибыли за год. Мы могли бы также рассчитать доход, поэтому сначала мы можем определить некоторые переменные и метод, чтобы уменьшить наш код.
Теперь давай заговор!
Вау, это похоже на экспоненту, но у нее есть огромные провалы. Они должны соответствоватьрецессия начала 1990-хидоткомовский пузырь, Это довольно интересно видеть в данных. Но почему прибыль возвращается к еще более высоким уровням после каждой рецессии?
Может быть, доходы могут рассказать нам больше.
Это добавляет другую сторону истории. Доходы отнюдь не так сильно пострадали, это отличная бухгалтерская работа из финансовых отделов.
С небольшой помощьюиз переполнения стекамы можем наложить эти графики с +/- их стандартными отклонениями.
Это ошеломляет, стандартные отклонения огромны. Некоторые компании из списка Fortune 500 зарабатывают миллиарды, в то время как другие теряют миллиарды, и риск увеличивается вместе с ростом прибыли за последние годы. Возможно, некоторые компании работают лучше, чем другие; Являются ли прибыли первых 10% более или менее волатильными, чем нижние 10%?
Есть много вопросов, которые мы могли бы рассмотреть далее, и легко увидеть, как процесс работы в блокноте соответствует собственному мыслительному процессу, поэтому сейчас пришло время подвести этот пример к концу. Этот поток помог нам легко исследовать наш набор данных в одном месте без переключения контекста между приложениями, и наша работа сразу становится доступной и воспроизводимой. Если бы мы хотели создать более краткий отчет для конкретной аудитории, мы могли бы быстро реорганизовать нашу работу, объединив ячейки и удалив промежуточный код.
Поделиться своими ноутбуками
Когда люди говорят о совместном использовании своих ноутбуков, обычно они рассматривают две парадигмы. Чаще всего люди разделяют конечный результат своей работы, как и сама эта статья, что означает обмен неинтерактивными, предварительно отрендеренными версиями своих ноутбуков; Тем не менее, также возможно совместное использование ноутбуков с такими вспомогательными системами контроля версий, какГит,
Тем не менее, естьнесколькорождающийсякомпаниипоявляются в Интернете, предлагая возможность запуска интерактивных ноутбуков Jupyter в облаке.
Прежде чем поделиться
Общая записная книжка будет отображаться точно в том состоянии, в котором она находилась при экспорте или сохранении, включая вывод любых ячеек кода. Поэтому, чтобы обеспечить совместимость вашего ноутбука, так сказать, есть несколько шагов, которые вы должны предпринять, прежде чем делиться:
Это гарантирует, что ваши записные книжки не будут содержать промежуточный вывод, будут иметь устаревшее состояние и будут выполнены в порядке на момент обмена
Экспорт ваших записных книжек
Jupyter имеет встроенную поддержку экспорта в HTML и PDF, а также в некоторые другие форматы, которые вы можете найти в меню «Файл> Загрузить как». Если вы хотите поделиться своими записными книжками с небольшой частной группой, эта функция может ну все, что тебе нужно. Действительно, поскольку многим исследователям в академических учреждениях предоставляется какое-то общедоступное или внутреннее веб-пространство, и поскольку вы можете экспортировать блокнот в файл HTML, блокноты Jupyter могут быть особенно удобным способом для них поделиться своими результатами с коллегами.
GitHub
Если у вас есть учетная запись GitHub, самый простой способ поделиться записной книжкой на GitHub на самом деле вообще не требует Git. С 2008 года GitHub предоставляет сервис Gist для размещения и совместного использования фрагментов кода, каждый из которых имеет свой собственный репозиторий. Чтобы поделиться блокнотом с помощью Gists:
Это должно выглядеть примерно так:
Если вы создали общедоступную Gist, теперь вы сможете поделиться ее URL с кем угодно, а другие смогутвилка и клонтвоя работа.
Создание собственного репозитория Git и распространение его на GitHub выходит за рамки этого руководства, ноGitHub предоставляет множество руководствдля вас, чтобы начать самостоятельно.
Nbviewer
Вырос, чтобы сделатьсотни тысячК 2015 году NBViewer является самым популярным средством рендеринга ноутбуков в Интернете. Если у вас уже есть место для размещения ваших ноутбуков Jupyter в Интернете, будь то GitHub или где-либо еще, NBViewer отобразит ваш блокнот и предоставит совместно используемый URL-адрес вместе с ним. Предоставляется как бесплатный сервис в рамках проекта Jupyter, он доступен по адресуnbviewer.jupyter.org,
Последние мысли
Начав с основ, мы познакомились с естественным рабочим процессом ноутбуков Jupyter, углубились в более продвинутые функции IPython и, наконец, научились делиться своей работой с друзьями, коллегами и миром. И мы сделали все это из самой записной книжки!
Должно быть понятно, как ноутбуки способствуют продуктивному опыту работы за счет сокращения переключения контекста и эмуляции естественного развития мыслей во время проекта. Сила Jupyter Notebooks также должна быть очевидна, и мы рассмотрели множество рекомендаций, чтобы вы начали изучать более продвинутые функции в своих собственных проектах.
Если вы хотите больше вдохновения для своих собственных ноутбуков, Jupyter объединилгалерея интересных ноутбуков Jupyterчто вы можете найти полезным иДомашняя страница Nbviewerссылки на некоторые действительно модные примеры качественных ноутбуков. Также проверьте наш списокJupyter ноутбуков советы,
Хотите узнать больше о ноутбуках Jupyter? У нас естьуправляемый проектВы можете быть заинтересованы в.


























