Cloud MSW: облачная СУБД с поиском по похожести

В настоящей брошюре описывается СУБД "Cloud MSW". Данная СУБД предлагается тем, кто разрабатывает приложения для работы с большими данными и нуждается в организации распределенного хранения, множественного доступа и быстрого поиска данных по критериям, которые принято называть «похожестью».

ACTIVE DATABASE ARCHITECTURE FOR XML DOCUMENTS (English)

Презентация, подготовленная Андреем Логвиновым для международной конференции CAINE-2008

Single-attribute Distributed Metrized Small World Data Structure (English)

Статья, отправленная на конференцию "IEEE International Conference on Intelligent Computing and Intelligent Systems 2009". В статье рассматривается возможность использования структуры данных Metrized Small World для создания хранилищ с контентной адресацией (CAS). Результаты экспериментов подтверждают пригодность структуры MSW для данной цели.

Content Addressable Storage

Презентация, в которой рассматривается сущность и основные свойства систем хранения данных с контентной адресацией, а также возможность использования структуры данных Metrized Small World для создания подобных систем.

Анализ архитектур сетей предоставления сервисов

Результаты исследования сервисных сетей различных топологий на основе их математичеой модели . Сравнивались такие свойства сетей как: масштабируемость, доступность сервисов, системная доступность, стоимость системной доступности и коммуникативная стоимость. Результаты работы особенно интересны в приложении к коммуникационным (в том числе компьютерным) сетям.

Metrized Small World Properties Based Data Structure

В данной статье рассматривается разработанная исследователями компании MeraLabs структура хранения данных, называемая «метризованный тесный мир» (Metrized Small World, MSW). Данные, хранимые в такой структуре, представлены набором структурированных единиц хранения, между которыми введена псевдометрика, характеризующая их относительное сходство. Благодаря этому можно построить граф, вершинами которого являются вышеописанные единицы хранения, а рёбра создаются по определенным принципам, благодаря чему граф обладает свойстами «тесного мира». Эти свойста позволяют создавать алгоритмы, производящие поиск данных за время, пропорциональное логарифму от размера хранилища. В статье описаны основные алгоритмы на структуре данных MSW, а также её свойства, полученные экспериментальным путём на прототипе структуры MSW. См. также презентацию для этой статьи.

Metrized Small World Based Data Structure

Данная статья детально описывает структуру хранения данных «метризованный тесный мир» (Metrized Small World, MSW). Принцип, положенный в основу создания такой структуры данных, заключается в том, чтобы соединить все единицы хранения таким образом, чтобы они хранили лишь список ссылок на своих ближайших соседей, необходимый для создания ассоциативного алгоритма поиска, суть которого заключается в обходе все единиц хранения данных, соответсвующих маске поискового запроса, поданного на вход системы. Для создания ссылок между единицами хранения используется механизмы случайных графов «тесного мира», а также псеводметрика, введенная между единицами хранения. Для создания распределенного индекса в ходе исследования был разработан механизм вычисления псевдометрики между единицами хранения в формате XML. В статье также приведены практические результаты, подтверждающие верность теоретических оценок и доказывающие возможность использования структуры MSW для создания хранилищ данных объёмом в десятки и сотни петабайт.

Metrized Small World Properties Based Data Structure (presentation)

Презентация для статьи Metrized Small World Properties Based Data Structure, которая была использована в докладе на конференции SEDE 2008 в Лос Анжелесе.

Active XML Database Architecture

В данной статье рассматривается инновационная архитектура баз данных, расчитанная на построение очень больших, масштабируемых распределнных хранилищ для слабоструктурированных данных. Основной идеей является то, что каждая единица данных является активной, способной взаимодействовать с другими единицами хранения и клиентами базы данных. Это, в сочетании с особой высокоуровневой структурой, обазуемой единицами хранения (граф «метризованного тесного мира»), позволяет осуществить эффективное распределение единиц хранения данных по множеству серверов базы данных и обеспечивает неограниченную масштабируемость хранилища данных. При этом время поиска остается пропорциональным логарифму от размера хранилища. В данной статье описана структура базы данных, её свойства и основные алгоритмы, используемые при её функционировании.

Система хранения бумажных документов, основанная на RFID (презентация, англ.)

Концепция системы хранения бумажных документов, использующая метки RFID для связи документов с их цифровыми описаниями, хранимыми в системе MSW, а также для определения их физического местоположения. Презентация написана на английском языке.

Веб-ориентированный подход к отображению EPC кодов на описания единиц продукции (презентация, англ.)

Концепция системы отображения EPC-кодов единиц продукции на их Web-описания, обновляемые по мере того, как единица продукции проходит через различные стадии жизненного цикла.

Крупномасштабные системы учета материальных ресурсов на основе РЧИ и Web технологий (презентация)

Концепция построения крупномасштабных систем учета материальных ресурсов на основе технологий радиочастотной идентификации и глобального представления каждого предмета имущества в сети Интернет.

Active Database Architecture for XML documents

В данной статье рассмотрена новая архитектура баз данных, расчитанная на построение очень больших, масштабируемых распределнных хранилищ для слабоструктурированных данных. Основной идеей является то, что каждая единица данных является активной, способной взаимодействовать с другими единицами хранения и клиентами базы данных. Это, в сочетании с особой высокоуровневой структурой, обазуемой единицами хранения (граф «метризованного тесного мира»), позволяет осуществить эффективное распределение единиц хранения данных по множеству серверов базы данных и обеспечивает неограниченную масштабируемость хранилища данных. При этом время поиска остается пропорциональным логарифму от размера хранилища. В статье описана структура базы данных, её свойства, а также основные алгоритмы, используемые при создании базы и поиске информации.

Как использовать Skoal

Инструкции к демо-версии веб-сервиса Skoal, базы данных химических элементов с поиском по подобию.