dataset это что такое

Dataset это что такое

Мы уже рассказывали о важности этапа подготовки данных (Data Preparation), результатом которого является обработанный набор очищенных данных, пригодных для обработки алгоритмами машинного обучения (Machine Learning). Такая выборка, называемая датасет (dataset), нужна для тренировки модели Machine Learning, чтобы обучить систему и затем использовать ее для решения реальных задач. Однако, поскольку в процессе обучения необходимо оценивать качество модели, различают несколько типов выборок. В этом материале мы расскажем, из чего состоит dataset, какие бывают датасеты и как их сформировать.

Что такое датасет для Data Mining и из чего он состоит

Dataset для машинного обучения – это обработанная и структурированная информация в табличном виде. Строки такой таблицы называются объектами, а столбцы – признаками. Различают 2 вида признаков [1]:

Признаковое описание характерно для задач классификации, когда имеется выборка – конечное множество объектов, для которых известно, к каким классам они относятся. Классовая принадлежность остальных объектов неизвестна. В процессе машинного обучения строится модель, способная классифицировать произвольный объект из исходного множества [2]. Практический смысл задач классификации состоит в предсказании возможных исходов на основе совокупности входных переменных, например, диагностика заболеваний, предварительная оценка эффективности месторождений полезных ископаемых, кредитный скоринг, распознавание речи, прогнозирование оттока клиентов (Churn Rate) и т.д.

В зависимости от варианта задачи классификации, целевой признак может выглядеть по-разному [1]:

Каким бывает dataset: типы выборок

Первичный набор исходных данных принято называть генеральной совокупностью. Процесс формирования выборок из генеральной совокупности называется порождение данных [3]. Выборка – это конечное подмножество элементов генеральной совокупности, изучив которое можно понять поведение исходного множества. Например, генеральная совокупность состоит из 150 тысяч посетителей сайта, а в выборку попали 250 из них.

Вероятностная модель порождения данных предполагает, что выборка из генеральной совокупности формируется случайным образом. Если все ее элементы одинаково случайно и независимо друг от друга распределены по исходному множеству (генеральной совокупности), выборка называется простой. Простая выборка является математической моделью серии независимых опытов и, как правило, используется для машинного обучения. При этом для каждого этапа Machine Learning необходим свой набор данных [3]:

Как сформировать выборку для Data Mining

Методы формирования обучающих и оценочных выборок зависят от класса задачи, решаемой с помощью машинного обучения [1]:

При соблюдении этих условий объемы обучающей и оценочных выборок могут существенно различаться. Например, размер валидационного датасета может составлять всего 10% генеральной совокупности. Главное в формировании выборок – ни в коем случае не объединять обучающий датасет и с оценочными (тестовым и валидационным), поскольку это грозит переобучением модели Machine Learning. В этом случае модель получит высокие оценки качества в процессе тренировки, но не покажет такого результата на реальных данных.

После того, как выборка сформирована, наступают следующие процессы CRISP-DM: очистка данных и работа с признаками: генерация, трансформация, нормализация и отбрасывание лишних переменных, чтобы исключить мультиколлинеарность факторов и понизить размерность модели Machine Learning. Об этом мы расскажем в следующих статьях.

Формирование выборок – начальный этап Data Preparation

Вся практика Data Preparation в нашем новом курсе для аналитиков Big Data: подготовка данных для Data Mining. Присоединяйтесь!

Источник

Как собрать датасет за неделю: опыт студентов магистратуры «Наука о данных»

Привет, Хабр! Сегодня хотим представить вам некоммерческий открытый датасет, собранный командой студентов магистратуры «Наука о данных» НИТУ МИСиС и Zavtra.Online (подразделении SkillFactory по работе с вузами) в рамках первого учебного Дататона. Мероприятие проходило как один из форматов командной практики. Данная работа заняла первое место из 18 команд.

Датасет содержит полный список объектов торговли и услуг в Москве с транспортными, экономическими и географическими метаданными. Исходная гипотеза состоит в том, что близость объекта к транспортным узлам является одним из важнейших показателей и ключевым фактором экономического успеха. Мы попросили команду детально описать свой опыт сбора такого датасета, и вот что получилось.

TLTR: Ближе к концу статьи вы найдёте информативные графики, карты и ссылки.

Немного про сам Дататон

Программа магистратуры «Наука о данных» НИТУ МИСиС и Zavtra.Online рассчитана на два года — т.е четыре семестра и раз в семестр для студентов будет проводиться хакатон, делая обучение больше ориентированным на решение практических задач. Первый хакатон был посвящен сбору датасета, поэтому и назвали его соответственно — «Дататон».

Всего в Дататоне приняло участие 90 студентов. Перед ними поставили задачу — собрать датасет, который может использоваться в продукте, основанном на Data Science.

Идею для сбора датасета предлагали сами студенты, с оглядкой на потребности общества или бизнеса — так что актуальность стала одним из главных критериев оценки и выбора победителей.

Оценивать команды позвали менторов — практикующих специалистов по Data Science высокого уровня из таких компаний как: Align Technology, Intellivision, Wrike, Мерлин АИ, Лаборатория Касперского, Auriga, Huawei, SkillFactory.

Начало работы над датасетом

При выборе темы для нашего датасета мы руководствовались известным принципом «предвидеть — значит управлять». Поиск новых гипотез — не самая простая задача, особенно когда одними из критериев выступают практичность и ориентация на потребности гипотетического заказчика. Трудно найти неразмеченную область, используя только лишь открытые данные.

Основная работа по сбору и обработке была проделана за 5 дней, остальное время до публикации мы исправляли недостатки, незначительно обогащали датасет и оптимизировали его структуру.

Фундаментальной идеей нашего датасета является гипотеза, что окрестности перспективных транспортно-пересадочных узлов Москвы (далее — ТПУ) станут хорошими зонами для развития бизнеса. Что вообще представляет из себя концепция ТПУ?

Какие проблемы решает датасет?

Основная гипотеза тривиальна и лежит на поверхности. Больший интерес представляют уточняющие вопросы от потенциального предпринимателя, которые можно задать, основываясь на ней. Например:

Наш датасет может служить основой для аналитики и обучения линейных или логистических регрессий, задач классификации или кластеризации. Он подходит для наглядной визуальной демонстрации действующих объектов торговли и услуг в Москве с привязкой к крупным транспортным узлам города. Мы уверены, что он содержит множество «скрытых данных», которые ждут, когда их обнаружат.

1. Описание источников

1.1 Источники

В датасете были использованы следующие данные с сайта Портал открытых данных правительства города Москвы:

1.2 Структура датасета

Основу структуры данных составляют уникальные объекты торговли и услуг, каждому из которых соответствует набор метаданных, включающих в себя такие сведения, как:

Для сложных вложенных объектов мы использовали списки и словари, поскольку организованный доступ к такой структуре значительно проще, нежели парсинг строковых объектов. В целом датасет содержит большое разнообразие типов данных.

Это пример не только объединения, но и неточности отдельных полей, о чем будет следующий раздел

1.3 Качество данных и проблемы при их сборе

Качество исходных данных в целом оказалось удовлетворительным, но недостаточным для реализации всех наших амбиций. В ходе проверки мы обнаружили, что Москва значительно уступает по этому показателю ряду мировых столиц. Также мы заметили некоторые ошибки и неточности, которые пришлось обрабатывать как отдельные выбросы или оставлять на совести авторов источников.

Пример спорных данных

2. Обработка данных

2.1 Данные об объектах

После предварительной оценки имеющихся в распоряжении первичных данных (а это были данные об объектах торговли, услуг и ТПУ на территории Москвы) мы поняли, что ключевым элементом нашего датасета будут уникальные объекты торговли и услуг, которые мы объединили в единый центральный датасет. Всего мы получили более 78 000 записей, для которых помимо уникального ID и названия имеются сведения о:

2.2 Данные об административном делении

Эту информацию, в том числе географические и демографические параметры, мы обнаружили на Википедии в относительно актуальном состоянии на начало 2020 года. Мы автоматизировали процесс выгрузки сведений путём написания собственной функции для парсинга html-страниц. Незначительными трудностями, с которыми мы столкнулись, стали:

2.3 Данные о зонах охвата

Зоны охвата являются не объективной оценкой, а лишь одной из теоретических методик оценки эффективности того или иного объекта торговли. Мы обнаружили методику оценки, которая разделяет объекты на 4 группы. В нашем случае достаточно было ввести лишь 3 из них — маленькие, средние и большие. Разделение мы осуществляли путем анализа типов и названий объектов. Например, приставка «Гипер-» с большой долей вероятности соответствует большому объекту. Исходя из размера мы определили зону, в радиусе которой торговый объект является привлекательным для клиентов.

2.4 Данные о ТПУ

В имеющемся датасете под ТПУ подразумевается любой транспортный объект, которых на территории Москвы более 250. Поэтому нам пришлось объединять их в комплексы, исходя из названий и расстояний между ними. Сведения об объектах включают в себя такие данные, как:

Каждый полученный комплекс центрирован относительно всех включенных объектов, при этом мы сохранили все данные об исходных ТПУ — они хранятся внутри в виде словарей, где ключами выступают оригинальные ID ТПУ.

2.5 Данные о стоимости аренды и покупки коммерческой недвижимости

Этот раздел стал одним из самых сложных, поскольку всё, что связано с недвижимостью, сильно монетизировано и является ценной информацией. В открытом виде актуальные сведения по каждому району получить очень трудно. Риэлторские агентства и торговые площадки не предоставляют бесплатные API, а парсинг торговых площадок был слишком ресурсозатратным в условиях ограничений срока проекта.

Поэтому мы не стали изобретать велосипед, а просто нашли наиболее удобный ресурс и вручную сохранили статистические сведения о стоимости продажи и аренды коммерческой недвижимости для торговых объектов, отдельно стоящих зданий и объектов общего назначения за 2020 год.

Несмотря на значительное количество пропусков и отдельные неточности, эти данные отражают ситуацию на рынке недвижимости и строятся на реальных объявлениях.

2.6 Данные о пассажиропотоке на станциях метро

Эта секция тоже оказалась достаточно проблемной, поскольку изначально идея найти такие сведения в актуальном виде показалась нереальной, а официальные ответы оказалось ждать очень долго (и не факт, что они были бы положительными). Долгое время эта задача оставалось нерешённой, и нам пришлось повторно рассматривать буквально каждую крупицу информации, даже явно устаревшей.

Иронично, что обнаруженная ошибка в старом источнике позволила обнаружить подходящие данные. После повторной проверки мы поняли, что в одном из источников использованы данные за 2019 год, при этом подпись содержит указание на 2016 год. Эта подпись и сбила нас при первой оценке. Актуальность подтвердилась наличием данных по построенным в 2019 году объектам метро.

Впрочем, сами данные тоже оказались не оптимизированы для парсинга. Мы столкнулись с дублями и артефактами типа «100000 тыс. тыс. чел в сутки», которые пришлось отыскивать и приводить к общему виду. Тем не менее, как уже упомянуто в разделе о качестве данных, отдельные показатели по станциям явно завышены и ошибочны. И эту проблему можно решить только уточнением из первоисточника.

2.7 Новые признаки и данные

Собрать числовые или строковые данные — мало. Эти данные важно уметь трактовать и выделять на их основе новые параметры или свойства. Поскольку наша гипотеза строилась на принадлежности объекта к ближайшему ТПУ, мы написали алгоритм поиска ближайших объектов и для каждого уникального объекта сопоставили:

Небольшой кусок датасета с бинарными признаками

2.8 Итоговый датасет

В результате объединения мы получили датасет размерностью 44 столбца и 78086 строк. В формате Pandas он занимает около 25,9+ MB. Если разбить столбцы на тематические сегменты, то в нём содержатся данные о:

2.9 Корреляционная матрица

Что можно сказать по полученной корреляционной матрице?

3. Немного визуализаций

3.1 Датасет на карте Москвы

Наконец-то мы дошли до самой интересной части любого датасета, своеобразный момент истины! Апогеем сбора является визуализация данных, где можно не только оценить качество данных, но и найти коллизии, ошибки и выбросы.

Для визуализации мы написали свою функцию, которая использует библиотеку Folium. Метод удобен тем, что достаточно гибко визуализирует практически любые выборки из общего датасета. Параметры функции позволяют гибко настраивать визуальные признаки объектов. Поскольку каждый объект в нашем случае — слой, мешающие группы объектов легко отключить и оставить лишь необходимые.

Для большей наглядности на карте реализованы слои в виде административного деления по районам. В нашем случае за стандартное отображение мы приняли плотность объектов на каждый район города.

Пример отображения районов по плотности размещения объектов

Транспортная схема Москвы: здесь отображаются только ТПУ

Пример отображения с объектами — в данной выборке всего 10000 объектов из более чем 78 000

Пример отображения объектов по выделенному адресу — описание сформировано в виде HTML-кода

3.2 (Не)много графиков

Графики — отличный инструмент для анализа. В качестве демонстрации мы подготовили ряд графиков, чтобы наглядно продемонстрировать статистику по наиболее интересным параметрам датасета.

Вот, например, 20 крупнейших торговых сетей Москвы:

А если посмотреть, какие типы объектов самые популярные?

По типам услуг всё не так интересно, зато понятно, сколько всего объектов каждого типа есть в городе.

Теперь чуть более интересные цифры — количество объектов при ТПУ.

Руки чешутся посмотреть на самый верхний ТПУ «Профсоюзная». Почему бы и да? На этом скриншоте размещаются больше 2000 объектов, для которых этот ТПУ ближайший.

Хорошо, как насчёт того, чтобы узнать, сколько из объектов в городе являются сетевыми? Получается красивый пирог с почти идеальной четвертью. Занятно. Пусть 1 и 0 вас не пугают, это как раз и есть пример бинарного признака, где 1 означает, что объект входит в какую-либо крупную сеть.

Раз уж мы решили строить топы, почему бы не узнать адрес, по которому располагается большее число объектов? Легко!

Найти его не так уж сложно. Список впечатляет:

И напоследок — немного более сложной экономической статистики. Что если поделить все ТПУ на группы от проектируемых до уже сданных в эксплуатацию? Какое стандартное отклонение (сигма), в рублях, за аренду торговых площадей или, скажем, при приобретении отдельно стоящих зданий будет в этих группах?

Судя по графикам, разброс цен на аренду и покупку недвижимости около уже построенных ТПУ заметно больше, рынок недвижимости стабильнее в районах со строящимися или проектируемыми ТПУ. Это можно использовать для оценки эффективности инвестиций в недвижимость.

Представленные графики — лишь малая часть потенциала датасета, который может быть расширен в дальнейшем.

4. Заключение

4.1 Варианты применения

Наш датасет включает в себя большое количество демографических, географических, экономических и описательных данных, которые расширяют представление об имеющихся объектах торговли и услуг.

Спектр применения этих данных очень широк. Они могут быть сегментированы или объединены в новые признаки, на основе которых можно строить модели машинного обучения. Наиболее очевидные варианты применения:

4.2 Целевая аудитория

Датасет может быть интересен:

4.3 Достоинства и недостатки

Недостатки нашего датасета обусловлены объективными причинами — многие информационные источники содержат неточные или неполные сведения, что невозможно нивелировать постобработкой. Часть сведений вообще невозможно найти в открытом доступе. Однако мы создали все условия, чтобы на практике данные можно было легко обновить или добавить новые.

При использовании датасета стоит учитывать наиболее проблемные участки, которые могут создать заметные шумы. Особое внимание стоит обратить на следующие нюансы:

4.4 Вместо резюме

Надеемся, что наши наработки не останутся без внимания и их будут использовать для обучения моделей и поиска инсайтов как в учебных целях, так и для решения проблем реального бизнеса.

Узнать больше про магистратуру можно на сайте data.misis.ru и в Telegram канале.

Участники команды Data SkyScrapers

Артем Филиппенко — Тимлид / Программирование / Автор статьи
Юлия Компаниец — Программирование / Алгоритмизация / Визуализация
Егор Петров — Программирование / Парсинг / Поддержка репозитория
Вячеслав Кандыбин — Парсинг / Поиск источников
Ильдар Габитов — Координация / Анализ
Сергей Гильдт — Помощь в составлении статьи

Мы хотели бы выразить благодарность кураторам, преподавателям и экспертам за организацию Дататона. Это был отличный опыт и возможность самостоятельно проявить себя в решении практических задач, а также получить развернутую оценку от профессиональных Дата-сайентистов.

Источник

Data Set Класс

Определение

Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.

Представляет кэш в памяти для данных.

Примеры

DataSet, который представляет собой кэш данных, получаемый из источника данных в памяти, является основным компонентом архитектуры ADO.NET. Объект DataSet состоит из коллекции DataTable объектов, которые можно связать друг с другом с DataRelation объектами. Целостность данных в можно также обеспечить DataSet с помощью UniqueConstraint ForeignKeyConstraint объектов и. Дополнительные сведения о работе с DataSet объектами см. в разделе наборы данных, DataTables и DataSets.

В то время как DataTable объекты содержат данные, объект DataRelationCollection позволяет перемещаться по иерархии таблиц. Таблицы содержатся в DataTableCollection доступе через Tables свойство. При доступе к DataTable объектам Обратите внимание, что они чувствительны к регистру. Например, если один DataTable из них имеет имя «Mydatatable», а другой — «Mydatatable», то строка, используемая для поиска одной из таблиц, считается с учетом регистра. Однако если «Mydatatable» существует, а «Mydatatable» — нет, то строка поиска считается нечувствительной к регистру. Дополнительные сведения о работе с DataTable объектами см. в разделе Создание таблицыданных.

DataSetМожет считывать и записывать данные и схему в виде XML-документов. Затем данные и схема можно переносить по протоколу HTTP и использовать в любом приложении на любой платформе, поддерживающей XML. Схему можно сохранить в виде XML-схемы с помощью WriteXmlSchema метода, а схема и данные могут быть сохранены с использованием WriteXml метода. Для чтения XML-документа, включающего как схему, так и данные, используйте ReadXml метод.

В типичной многоуровневой реализации шаги для создания и обновления и, DataSet в свою очередь, обновления исходных данных:

Изменение данных в отдельных DataTable объектах путем добавления, обновления или удаления DataRow объектов.

Вызовите Merge метод, чтобы объединить изменения из второй DataSet в первый.

DataSetОбъекты и DataTable наследуются от и MarshalByValueComponent поддерживают ISerializable интерфейс для удаленного взаимодействия. Это единственные объекты ADO.NET, которые разрешают удаленное взаимодействие.

Замечания по безопасности

Сведения о наборах данных и безопасности DataTable см. в руководстве по безопасности.

Конструкторы

Инициализирует новый экземпляр класса DataSet.

Инициализирует новый экземпляр класса DataSet, содержащего заданные сведения о сериализации и контекст.

Инициализирует новый экземпляр класса DataSet.

Инициализирует новый экземпляр класса DataSet с заданным именем.

Свойства

Возвращает или задает значение, определяющее, учитывается ли регистр при сравнении строк в объектах DataTable.

Возвращает контейнер для компонента.

Возвращает или задает имя текущего DataSet.

Получает новое представление данных класса DataSet для осуществления фильтрации, поиска или перехода с помощью настраиваемого класса DataViewManager.

Возвращает значение, показывающее, находится ли компонент в настоящий момент в режиме разработки.

Возвращает или задает значение, определяющее соблюдение правил ограничения при попытке совершения операции обновления.

Возвращает список обработчиков событий, которые прикреплены к этому компоненту.

Получает значение, определяющее наличие ошибок в любом из объектов DataTable в классе DataSet.

Получает значение, указывающее, инициализирована ли таблица DataSet.

Возвращает или задает сведения о языке, используемые для сравнения строк таблицы.

Возвращает или задает пространство имен DataSet.

Возвращает или задает префикс XML, который является псевдонимом пространства имен класса DataSet.

Получает коллекцию соотношений, связывающих таблицы и позволяющих переходить от родительских таблиц к дочерним.

Возвращает или задает объект SerializationFormat для набора данных DataSet, который используется для удаленного взаимодействия.

Возвращает или задает объект SchemaSerializationMode для DataSet.

Возвращает или задает тип ISite для объекта DataSet.

Возвращает коллекцию таблиц класса DataSet.

Методы

Сохраняет все изменения, внесенные в класс DataSet после его загрузки или после последнего вызова метода AcceptChanges().

Начинает инициализацию DataSet, используемого в форме или другим компонентом. Инициализация происходит во время выполнения.

Удаляет из класса DataSet любые данные путем удаления всех строк во всех таблицах.

Копирует структуру класса DataSet, включая все схемы, соотношения и ограничения объекта DataTable. Данные не копируются.

Копирует структуру и данные для DataSet.

Возвращает объект DataTableReader с одним результирующим набором для каждой последовательности DataTable в той же последовательности, в которой таблицы отображаются в коллекции Tables.

Возвращает объект DataTableReader с одним результирующим набором для каждой таблицы DataTable.

Освобождает все ресурсы, занятые модулем MarshalByValueComponent.

Освобождает неуправляемые ресурсы, используемые объектом MarshalByValueComponent, а при необходимости освобождает также управляемые ресурсы.

Завершает инициализацию DataSet, используемого в форме или другим компонентом. Инициализация происходит во время выполнения.

Определяет, равен ли указанный объект текущему объекту.

Получает копию класса DataSet, содержащую все изменения, внесенные после его загрузки или после последнего вызова метода AcceptChanges().

Получает копию таблицы DataSet, содержащую все изменения, внесенные после ее последней загрузки или после вызова метода AcceptChanges() и отфильтрованные по параметру DataRowState.

Получает копию XmlSchemaSet для DataSet.

Служит хэш-функцией по умолчанию.

Заполняет объект сведений о сериализации данными, необходимыми для сериализации DataSet.

Возвращает сериализуемый экземпляр XmlSchema.

Десериализует данные таблицы из двоичного потока или XML-потока.

Возвращает средство реализации объекта IServiceProvider.

Возвращает объект Type для текущего экземпляра.

Возвращает XML-представление данных, хранящихся в классе DataSet.

Возвращает XML-схему для XML-представления данных, хранящихся в классе DataSet.

Получает значение, определяющее наличие изменений в классе DataSet, включая добавление, удаление или изменение строк.

Получает значение, определяющее наличие изменений в классе DataSet, включая добавление, удаление или изменение строк, отфильтрованных по типу DataRowState.

Применяет XML-схему из указанного объекта Stream к объекту DataSet.

Применяет XML-схему из указанного файла к классу DataSet.

Применяет XML-схему из указанного объекта TextReader к объекту DataSet.

Применяет XML-схему из указанного объекта XmlReader к объекту DataSet.

Десериализует все данные таблицы DataSet из двоичного потока или XML-потока.

Заполняет набор данных DataSet значениями из источника данных с помощью предоставляемого объекта IDataReader, использующего массив экземпляров DataTable для предоставления сведений о схеме и пространстве имен.

Создает неполную копию текущего объекта Object.

Осуществляет слияние массива объектов DataRow и текущего класса DataSet.

Осуществляет слияние массива объектов DataRow и текущего объекта DataSet, сохраняя или удаляя любые изменения в этом объекте DataSet и обрабатывая несовместимую схему в соответствии с заданными аргументами.

Осуществляет слияние указанного объекта DataTable и его схемы с текущим объектом DataSet.

Происходит при удалении объекта DataRelation из DataTable.

Происходит при удалении объекта DataTable из DataSet.

Посылает уведомление об изменении указанного свойства DataSet.

Считывает XML-схему и данные в DataSet, используя указанный класс Stream.

Считывает XML-схему и данные в DataSet, используя указанные объекты Stream и XmlReadMode.

Считывает XML-схему и данные в DataSet, используя указанный файл.

Считывает XML-схему и данные в DataSet, используя указанный файл и XmlReadMode.

Считывает XML-схему и данные в DataSet, используя указанный класс TextReader.

Считывает XML-схему и данные в DataSet, используя указанные объекты TextReader и XmlReadMode.

Считывает XML-схему и данные в DataSet, используя указанный класс XmlReader.

Считывает XML-схему и данные в DataSet, используя указанные объекты XmlReader и XmlReadMode.

Считывает XML-схему из указанного класса Stream в класс DataSet.

Считывает XML-схему из указанного файла в класс DataSet.

Считывает XML-схему из указанного класса TextReader в класс DataSet.

Считывает XML-схему из указанного класса XmlReader в класс DataSet.

Игнорирует атрибуты и возвращает пустой DataSet.

Отменяет все изменения, внесенные в класс DataSet после его создания или после последнего вызова метода AcceptChanges().

Очищает все таблицы и удаляет все связи, внешние ограничения и таблицы из DataSet. Для восстановления исходного состояния класса Reset() необходимо переопределить метод DataSet в подклассах.

Получает значение, определяющее необходимость сохранения значения свойства Relations.

Получает значение, определяющее необходимость сохранения значения свойства Tables.

Возвращает объект String, содержащий имя Component, если оно есть. Этот метод не следует переопределять.

Записывает текущие данные для DataSet с помощью указанного объекта Stream.

Записывает текущие данные для DataSet в указанный файл.

Записывает текущие данные для DataSet с помощью указанного объекта TextWriter.

Записывает текущие данные для DataSet в указанный класс XmlWriter.

Записывает структуру DataSet в качестве XML-схемы для указанного объекта Stream.

Записывает структуру класса DataSet в виде XML-схемы в файл.

Записывает структуру DataSet в качестве XML-схемы для указанного объекта TextWriter.

Записывает структуру DataSet в виде схемы XML для указанного объекта TextWriter.

Записывает структуру класса DataSet в виде XML-схемы в объект XmlWriter.

Записывает структуру DataSet в виде схемы XML для указанного объекта XmlWriter.

События

Добавляет обработчик события для ожидания события Disposed в компоненте.

Происходит после инициализации таблицы DataSet.

Происходит, если значения первичного ключа конечного и основного объектов DataRow совпадают, а свойство EnforceConstraints имеет значение true.

Явные реализации интерфейса

Описание этого члена см. в разделе ContainsListCollection.

Описание этого члена см. в разделе GetList().

Заполняет объект сведений о сериализации данными, необходимыми для сериализации DataSet.

Описание этого члена см. в разделе GetSchema().

Описание этого члена см. в разделе ReadXml(XmlReader).

Описание этого члена см. в разделе WriteXml(XmlWriter).

Применяется к

Потокобезопасность

Этот тип является надежным для многопоточных операций чтения. Необходимо синхронизировать любые операции записи.

Источник

dataset это что такое