НейроГалактика

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.



Пишу на Delphi

Сообщений 1 страница 4 из 4

1

Сабж...
:beta:
Здесь буду сообщать о том, что происходит и что получается... ну, и тут же буду просить совета у наших опытных программистов...  :-[

0

2

:beta:

Самое важное во всей нашей работе - это данные. Исходными данными для дальнейших изысканий для нас будут, как правило, некие временные ряды, представленные файлами котировок. Эти файлы могут быть созданы различными программами для торговли (торговыми терминалами), программами для анализа данных (аналитическими и/или статистическими пакетами) и другими программами, предназначенными для хранения (ведения) архивов котировок.

Отдельные "готовые" файлы данных также можно скачать из интернета или передать друг другу по электронной почте (например).

За время работы с файлами котировок (файлами данных) удалось отметить некоторые характерные особенности:

1) данные представлены различными форматами, однако, среди форматов можно найти некие общие принципы;
2) данные, к которым можно получить доступ характеризуются различной степенью полноты и непрерывности, которая, как правило, не удавлетворяет предъявляемым требованиям;
3) даже упакованные "классическими" архиваторами файлы данных все равно слишком велики и передача их через каналы связи представляет некоторую трудность;
4) обновление файлов данных не механизировано и требует участия человека, что невозможно считать высокопроизводительным интеллектуальным трудом.

В связи с вышеизложенным, мне представляется достаточно актуальным написание программного компонента, который мог бы выполнять следующие основные действия:

- уметь распознавать и прочитывать данные из файлов различных форматов (текстовых);
- уметь делать выводы о полноте и непрерывности данных;
- уметь объединять файлы данных (из различных форматов) (с целью улучшить фактор полноты данных);
- уметь получать данные в реальном времени и формировать собственные файлы данных:
  -- путем добавления в конец истории новых полученных из он-лайн источников данных котировок (поставщики котировок, брокерские компании);
  -- путем восстановления отсутствующих фрагментов по заданным алгоритмам и/или шаблонам (для восстановления можно использовать, например, генератор случайного числа, настроенный таким образом, чтобы выдавать временной ряд с такими статистическими показателями (стандартное отклонение, дисперсия, частота, и т.д.) какие наблюдаются у имеющегося временного ряда, при условии того, что будет задан уровень/цена + дата/время начала генерируемого фрагмента и уровень/цена + дата/время конца генерируемого фрагмента, а также периодичности (тики, минутки, часы, месяцы, годы);
  -- путем интерполяции данных, - т.е., "восстановления", например, тиков по минуткам, минуток по пятиминуткам, пятиминуток по пятнадцатиминуткам и т.д., с учетом, опять же, статистических характеристик временных рядов, характерных для данного финансового инструмента;
- уметь сохранять имеющиеся данные в каком-либо из "классических" и/или в собственном формате;
- уметь архивировать (упаковывать) данные.

Ну, вот... примерно такое я хотел бы...

Несколько вариантов  :beta: уже были написаны, но показать из всего этого - мне стыдно что-то. Ибо, то, что было написано можно расценивать лишь как эскизы. Однако, работа не была бесплодной. Появились некоторые новые мысли и удалось произвести некоторые обобщения. Работа продолжается.

.....................................................................................................................................................

0

3

Удалось более-менее формально описать "типичную" строку данных некоторого файла котировок. Следующий шаг - такое же более или менее формальное описание самого файла.

0

4

Ну, вот типичный файл, на мой взгляд, выглядеть должен приблизительно таким образом:

0