Поисковик по датасетам

Возможно вы уже слышали про www.quandl.com — поисковик для экономических данных по самым разным источникам. Теперь он обзавелся питоновским модулем: http://www.quandl.com/help/python. Вытаскиваемые данные уже в пандасовском формате.

Не уверен что тема заслуживает отдельного поста, ну да пусть.

Каша из дивидендов

Первый этап любого исследования — подготовка данных, в том числе ценовых. Если с фьючерсами и FX всё довольно просто, то с акциями могут возникнуть существенные проблемы при попытке корректного учета таких событий, как сплиты и дивиденды.

Бесплатные или дешевые популярные источники котировок, такие как Yahoo Finance, IQfeed и приказавший долго жить Quotes Plus к сожалению неверно учитывают то или иное событие. Еще историю дивидендов можно посмотреть на сайте NASDAQ и MorningStar .

Бывает несколько вариантов событий, которые могут существенно исказить цену акции:
1) выплата дивидендов
Читать дальше →

Хорошие данные это очень важно.

Столкнулся с такой проблемой.
Переписываю очередную модель с ТС на питон. Все хорошо.
Только по НЕПОНЯТНЫМ причинам 3х трейдов нету при верификации.
В упор понять не могу почему. ПРОСТО НЕТУ!
Проверил все функции в расчетах до 4 знака после запятой, перепроверил в екселе, никак.
Просто НЕТУ 3х трейдов в середине и все а дальше все как положенно идет.
Вразнобой, проверил на другом инструменте все норм идет.
В общем 30-40 строчек коду самого ядра — где решенье-принимательный модуль вдоль и поперек проверил. Переписал несколько раз.
(если дело не идет, брось и начни сначала —
Читать дальше →

Данные по сделкам участников конкурса ЛЧИ

Написал небольшой скрипт на питоне, выдёргивающий с сайта биржи данные по сделкам участников конкурса ЛЧИ и раскладывающий их по csv файлам.

Особенности скрипта: использование только внутренних библиотек питона, быстрый парсинг данных на основе регекспов. Имеется функциональность докачки данных, то есть вам не нужно каждый раз вытягивать всю информацию, достаточно ежедневно запускать скрипт и он будет подгружать только новые данные.

Читать дальше →

Стоимость электроэнергии в США, исторические данные

Искал данные для оценки эк. конъюнктуры, набрел на исторические ряды стоимости электроэнергии США (кстати там есть realtime 5 min snapspot, и даже интрадей, хотя понятно какой там паттерн):
www.gdfsuezenergyresources.com/index.php?id=33

Ради интереса посмотрел как менялась ст-ть эл. энергии в NY — хорошо видно когда включают кондиционеры.

55 000 economic time series from 45 sources with a single click

  Те, кто любит смотреть, сравнивать, рисовать и анализировать данные экономического происхождения — будут мне очень благодарны.
  Ну не то что бы мне лично, но федеральному резерву США, а точнее феду Сент-Луиса, который поддерживает в рабочем состоянии FRED (Federal Reserve Economic Data), онлайновую базу данных временных рядов экономического и финансового происхождения. От Евростата до агенства ДоуДжонс, от МВФ до Банка Японии. Уже доступно 55 000 рядов на исследование которых можно положить жизнь:
База: http://research.stlouisfed.org/fred2/
Источники: http://research.stlouisfed.org/fred2/sources

Впрочем тут нет ничего нового, ведь база расширяется довольно давно, если бы не одно но:
Фед СентЛуиса заказал удобнейший Add-On к Excel (говорят может работать и с LibreOffice) под Win и Mac.
Теперь отпала нужда в муторном импорте, работе с текстовиками. Все данные доступны в Excel сразу, в виде пунктов меню.
It's amazing. Экономисты (особенно те, кто не дружат с VB и прочими средствами автоматизации) должны хлопать в ладоши.

http://research.stlouisfed.org/fred-addin/install_windows.html