Data integrity scan что это
Сообщения: 52219
Благодарности: 15091
| Проверяет отказоустойчивые тома на готовность к быстрому восстановлению после сбоя |
| FriendlyName | ресилиенцисеттингнаме | OperationalStatus | HealthStatus | исмануалаттач | Размер | PSComputerName |
|---|---|---|---|---|---|---|
| Диск 4 | Зеркальное отображение | ОК | Работоспособно | Верно | 10 ТБ | Node-01. Конто. |
| Диск 3 | Зеркальное отображение | ОК | Работоспособно | Верно | 10 ТБ | Node-01. Конто. |
| Диск 2 | Зеркальное отображение | Без избыточности | Unhealthy | Верно | 10 ТБ | Node-01. Конто. |
| Диск 1 | Зеркальное отображение | Unhealthy | Верно | 10 ТБ | Node-01. Конто. |
Кроме того, после попытки перевести виртуальный диск в оперативный режим в журнал кластера (Дискрековеряктион) заносится следующая информация.
В случае сбоя диска или невозможности доступа системы к данным на виртуальном диске может произойти состояние «нет работоспособности «. Эта проблема может возникать, если на узле во время обслуживания узлов происходит перезагрузка.
Чтобы устранить эту проблему, выполните следующие действия.
Удалите затронутые виртуальные диски из CSV-файла. Они поместит их в группу «Доступное хранилище» в кластере и отобразятся как ResourceType «физический диск».
на узле, владеющем доступной группой служба хранилища, выполните следующую команду на каждом диске, который не находится в состоянии избыточности. чтобы узнать, на каком узле находится группа Available служба хранилища, можно выполнить следующую команду.
Задайте действие восстановления диска, а затем запустите диски.
Должно автоматически запуститься восстановление. Дождитесь завершения восстановления. Он может перейти в приостановленное состояние и запустить его снова. Для отслеживания хода выполнения:
После завершения восстановления и работоспособности виртуальных дисков измените параметры виртуального диска обратно.
Переведите диски в автономный режим и снова подключитесь к сети, чтобы Дискрековеряктион вступили в силу:
Добавьте затронутые виртуальные диски обратно в CSV-файл.
Дискрековеряктион — это параметр переопределения, который позволяет подключить объем дискового пространства в режиме чтения и записи без проверок. Свойство позволяет выполнять диагностику, почему том не поступает в оперативный режим. Он очень похож на режим обслуживания, но его можно вызвать для ресурса в неисправном состоянии. Он также позволяет получить доступ к данным, которые могут быть полезны в таких ситуациях, как «без избыточности», где можно получить доступ к любым данным и скопировать их. Свойство Дискрековеряктион было добавлено в 22 февраля 2018, обновление, KB 4077525.
Состояние отсоединения в кластере
| FriendlyName | ресилиенцисеттингнаме | OperationalStatus | HealthStatus | исмануалаттач | Размер | PSComputerName |
|---|---|---|---|---|---|---|
| Диск 4 | Зеркальное отображение | ОК | Работоспособно | Верно | 10 ТБ | Node-01. Конто. |
| Диск 3 | Зеркальное отображение | ОК | Работоспособно | Верно | 10 ТБ | Node-01. Конто. |
| Диск 2 | Зеркальное отображение | Отсоединен | Неизвестно | Верно | 10 ТБ | Node-01. Конто. |
| Диск 1 | Зеркальное отображение | Отсоединен | Неизвестно | Верно | 10 ТБ | Node-01. Конто. |
Кроме того, на узлах могут регистрироваться следующие события:
Отсоединенное рабочее состояние может произойти, если журнал «грязного» отслеживания региона (DRT) заполнен. дисковые пространства использует «грязное» отслеживание региона (DRT) для зеркальных пространств, чтобы гарантировать, что при сбое питания все актуальные обновления метаданных записываются в журнал, чтобы убедиться в том, что дисковое пространство может вернуть или отменить операции по восстановлению дискового пространства, чтобы вернуть дисковое пространство в гибкое и устойчивое состояние после восстановления питания и резервного копирования системы. Если журнал DRT заполнен, виртуальный диск нельзя перевести в режим «в сети» до тех пор, пока метаданные DRT не будут синхронизированы и сброшены. Этот процесс требует выполнения полной проверки, что может занять несколько часов.
Чтобы устранить эту проблему, выполните следующие действия.
Удалите затронутые виртуальные диски из CSV-файла.
Выполните следующие команды на каждом диске, который не находится в режиме «в сети».
Выполните следующую команду на каждом узле, в котором отключенный том находится в режиме «в сети».
Эту задачу следует инициировать на всех узлах, на которых отключенный том находится в режиме «в сети». Должно автоматически запуститься восстановление. Дождитесь завершения восстановления. Он может перейти в приостановленное состояние и запустить его снова. Для отслеживания хода выполнения:
«Проверка целостности данных для восстановления после сбоя» — это задача, которая не отображается как задание хранилища и не имеет индикатора хода выполнения. Если задача отображается как выполняемая, она работает. По завершении он будет отображаться как завершенный.
Кроме того, можно просмотреть состояние выполняемой задачи расписания с помощью следующего командлета:
Как только будет завершено восстановление целостности данных для восстановления после сбоя, восстановление завершится, а виртуальные диски будут работоспособными, измените параметры виртуального диска обратно.
Переведите диски в автономный режим и снова подключитесь к сети, чтобы Дискрековеряктион вступили в силу:
Добавьте затронутые виртуальные диски обратно в CSV-файл.
Значение дискрунчкдск 7 используется для присоединения объема дискового пространства и создания раздела в режиме только для чтения. Это позволяет обнаруживать пробелы для самостоятельного обнаружения и самовосстановления, запуская восстановление. Исправление будет запущено автоматически после подключения. Он также позволяет получить доступ к данным, что может быть полезно для получения доступа к любым данным, которые можно копировать. Для некоторых условий сбоя, таких как полный журнал DRT, необходимо запустить проверку целостности данных для запланированной задачи восстановления после сбоя.
Задача «Проверка целостности данных для восстановления после сбоя » используется для синхронизации и очистки полного журнала отслеживания изменений региона (DRT). Выполнение этой задачи может занять несколько часов. «Проверка целостности данных для восстановления после сбоя» — это задача, которая не отображается как задание хранилища и не имеет индикатора хода выполнения. Если задача отображается как выполняемая, она работает. После завершения он будет отображаться как завершенный. Если отменить задачу или перезапустить узел во время выполнения этой задачи, задача должна начаться с самого начала.
Событие 5120 с STATUS_IO_TIMEOUT c00000b5
для Windows Server 2016: чтобы уменьшить вероятность возникновения этих симптомов при установке обновления с исправлением, рекомендуется использовать процедуру режима обслуживания служба хранилища ниже, чтобы установить 18 октября 2018, накопительное обновление для Windows Server 2016 или более поздней версии, если установленные узлы уже установлены. Windows Server 2016 накопительное обновление, выпущенное 8 мая, 2018 – 9 октября 2018 г.
При перезагрузке узла событие 5120 заносится в журнал системных событий и включает один из следующих кодов ошибок:
Когда регистрируется событие 5120, создается динамический дамп для получения отладочной информации, которая может привести к дополнительным симптомам или повлиять на производительность. Создание динамического дампа создает краткую паузу, чтобы сделать возможным создание моментального снимка памяти для записи файла дампа. Системы, имеющие большой объем памяти и находящиеся под нагрузкой, могут привести к тому, что узлы удаляют членство в кластере, а также регистрировать следующее событие 1135.
изменение, представленное в 8 мая 2018 до Windows Server 2016, было накопительным обновлением для добавления отказоустойчивых дескрипторов smb для дисковые пространства прямых сетевых сеансов smb внутри кластера. Это было сделано для повышения устойчивости к временным сбоям сети и улучшению того, как Роце обрабатывает перегрузку сети. Эти улучшения также нечаянно увеличивают время ожидания, когда подключения SMB пытаются повторно подключиться и ожидают истечения времени ожидания при перезапуске узла. Эти проблемы могут повлиять на систему под нагрузкой. Во время незапланированного простоя наблюдается задержка ввода-вывода до 60 секунд, а система ожидает подключения к времени ожидания. чтобы устранить эту проблему, установите 18 октября 2018 г., накопительное обновление для Windows Server 2016 или более поздней версии.
Завершить процесс завершения процесса:
Выполните командлет Get-VirtualDisk и убедитесь, что значение Хеалсстатус является работоспособным.
Остановите узел, выполнив следующий командлет:
вставьте диски на этом узле в режиме служба хранилища обслуживания, выполнив следующий командлет:
Запустите командлет Get-физический и убедитесь, что значение OperationalStatus находится в режиме обслуживания.
после перезагрузки узла удалите диски на этом узле из режима служба хранилища обслуживания, выполнив следующий командлет:
Возобновите работу узла, выполнив следующий командлет:
Проверьте состояние заданий повторной синхронизации, выполнив следующий командлет:
Отключение динамических дампов
Чтобы уменьшить влияние создания динамического дампа на системы с большим объемом памяти и наблюдать нагрузку, вы можете дополнительно отключить создание динамического дампа. Ниже приведены три варианта.
Эта процедура может препятствовать сбору диагностических сведений, которые служба поддержки Майкрософт могут потребоваться для изучения этой проблемы. Агент поддержки может попросить вас повторно включить динамическое создание дампа на основе конкретных сценариев устранения неполадок.
Существует два метода отключения динамических дампов, как описано ниже.
Метод 1 (рекомендуется в этом сценарии)
Чтобы полностью отключить все дампы, включая динамические дампы всей системы, выполните следующие действия.
Чтобы изменения nПараметр реестра вступили в силу, необходимо перезагрузить компьютер.
После установки этого раздела реестра создание динамического дампа завершится сбоем и создаст ошибку «STATUS_NOT_SUPPORTED».
Метод 2
по умолчанию отчеты об ошибках Windows допускает только один ливедумп для каждого типа отчета в течение 7 дней и только 1 ливедумп на компьютер в течение 5 дней. Это можно изменить, установив следующие разделы реестра, чтобы разрешить только один Ливедумп на компьютере.
Метод 3
Чтобы отключить создание динамических дампов в кластере (например, при записи события 5120), выполните следующий командлет:
Этот командлет немедленно влияет на все узлы кластера без перезагрузки компьютера.
Производительность медленных операций ввода-вывода
если вы видите скорость медленных операций ввода-вывода, проверьте, включен ли кэш в конфигурации дисковые пространства Direct.
Существует два способа проверки:
Использование журнала кластера. Откройте журнал кластера в текстовом редакторе и выполните поиск по запросу «[= = = SBL Disks = = =]». Это будет список дисков на узле, на котором был создан журнал.
Диск с включенным кэшем. Пример: Обратите внимание, что состояние — Качедискстатеинитиализедандбаунд, а здесь есть GUID, представленный здесь.
Кэш не включен: здесь можно увидеть, что GUID отсутствует, а состояние — Качедискстатенонхибрид.
Кэш не включен: Если все диски одного типа имеют один и тот же вариант, по умолчанию не включено. Здесь можно увидеть, что идентификатор GUID отсутствует, а состояние — Качедискстатеинелигибледатапартитион.
Использование Get-PhysicalDisk.xml из СддкдиагностиЦинфо
Как уничтожить существующий кластер, чтобы вы могли использовать те же диски снова
в дисковые пространства прямого кластера после отключения дисковые пространства direct и использования процесса очистки, описанного в разделе чистые диски, кластерный пул носителей по-прежнему остается в автономном состоянии, а служба работоспособности удаляется из кластера.
Следующим шагом является удаление искусственного пула носителей:
Теперь при запуске Get-физический на любом из узлов вы увидите все диски в пуле. Например, в лаборатории с кластером из 4 узлов с 4 дисками SAS 100 ГБ каждого из этих узлов. в этом случае после отключения служба хранилищаного пробела, который удаляет слой шины (служба хранилища), но оставляет фильтр, если вы запускаете Get-физическийдиск, он должен сообщить 4 диска за исключением локального диска операционной системы. Вместо этого отображается 16. Это одинаково для всех узлов в кластере. При выполнении команды Get-Disk вы увидите, что локально подключенные диски пронумерованы как 0, 1, 2 и т. д., как показано в примере выходных данных:
| число; | Понятное имя | Серийный номер | HealthStatus | OperationalStatus | Общий размер | Стиль раздела |
|---|---|---|---|---|---|---|
| 0 | MSFT Вирту. | Работоспособно | Миграция по сети | 127 ГБ | GPT | |
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| 1 | MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | |
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| 2 | MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | |
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| 4 | MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | |
| 3 | MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | |
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW | ||
| MSFT Вирту. | Работоспособно | Автономная миграция | 100 ГБ | RAW |
сообщение об ошибке «неподдерживаемый тип носителя» при создании дисковые пространства прямого кластера с помощью Enable-ClusterS2D
При выполнении командлета Enable-ClusterS2D могут появиться ошибки, аналогичные приведенным ниже.
Чтобы устранить эту проблему, убедитесь, что адаптер HBA настроен в режиме HBA. Не следует настраивать HBA в режиме RAID.
Enable-ClusterStorageSpacesDirect зависает в ожидании, пока выводятся диски SBL или 27%
В отчете о проверке вы увидите следующие сведения:
Диск, подключенный к узлу, вернул связь с портом SCSI, а соответствующее устройство корпуса не найдено. оборудование несовместимо с дисковые пространства Direct (S2D), обратитесь к поставщику оборудования, чтобы проверить поддержку для служб отсека SCSI (SES).
Эта ошибка связана с картой расширения SAS HPE, которая находится между дисками и картой HBA. Расширитель SAS создает дубликат идентификатора между первым диском, подключенным к расширительу, и самого расширителя. Это разрешено в HPE смарт-массивов расширения SAS встроенного по: 4,02.
Серия P4600 контроллера домена Intel SSD не является уникальным
Вы можете столкнуться с проблемой, когда устройство Intel SSD DC P4600 Series сообщает примерно 16 байт NGUID для нескольких пространств имен, таких как 0100000001000000E4D25C000014E214 или 0100000001000000E4D25C0000EEE214, в примере ниже.
| uniqueid | deviceid | MediaType | BusType | номер | size | canpool задано | FriendlyName | OperationalStatus |
|---|---|---|---|---|---|---|---|---|
| 5000CCA251D12E30 | 0 | HDD | SAS | 7PKR197G | 10000831348736 | False | хгст | HUH721010AL4200 |
| EUI. 0100000001000000E4D25C000014E214 | 4 | SSD | NVMe | 0100_0000_0100_0000_E4D2_5C00_0014_E214. | 1600321314816 | Верно | СЕРВЕР | SSDPE2KE016T7 |
| EUI. 0100000001000000E4D25C000014E214 | 5 | SSD | NVMe | 0100_0000_0100_0000_E4D2_5C00_0014_E214. | 1600321314816 | Верно | СЕРВЕР | SSDPE2KE016T7 |
| EUI. 0100000001000000E4D25C0000EEE214 | 6 | SSD | NVMe | 0100_0000_0100_0000_E4D2_5C00_00EE_E214. | 1600321314816 | Верно | СЕРВЕР | SSDPE2KE016T7 |
| EUI. 0100000001000000E4D25C0000EEE214 | 7 | SSD | NVMe | 0100_0000_0100_0000_E4D2_5C00_00EE_E214. | 1600321314816 | Верно | СЕРВЕР | SSDPE2KE016T7 |
Чтобы устранить эту проблему, обновите встроенное по на дисках Intel до последней версии. Для устранения этой проблемы известны версии встроенного по QDV101B1 с мая 2018.
В 2018. в выпуске средства центра обработки данных Intel SSD входит обновление встроенного по QDV101B1 для ряда P4600 Intel SSD DC.
Физический диск «Исправен» и оперативное состояние «Удаление из пула»
в Windows Server 2016 дисковые пространства прямого кластера вы можете увидеть хеалсстатус для одного или нескольких физических дисков как «исправен», а параметр OperationalStatus — «(удаление из пула, ок)».
«Удаление из пула» является намерением, когда командлет Remove-физический вызывается, но хранится в состоянии работоспособности для поддержания состояния и позволяет выполнить восстановление в случае сбоя операции удаления. Можно вручную изменить значение OperationalStatus на работоспособное с помощью одного из следующих методов:
Ниже приведено несколько примеров, демонстрирующих выполнение сценария.
Копирование файлов выполняется слишком долго
При использовании проводника для копирования большого виртуального жесткого диска на виртуальный диск может возникнуть ошибка. копирование файлов занимает больше времени, чем ожидалось.
Использование проводника, Robocopy или xcopy для копирования большого виртуального жесткого диска на виртуальный диск не является рекомендуемым методом, так как это приведет к снижению ожидаемой производительности. процесс копирования не проходит через стек дисковые пространства Direct, который находится ниже в стеке хранилища, а действует как локальный процесс копирования.
если вы хотите протестировать дисковые пространства прямой производительности, мы рекомендуем использовать вмфлит и Diskspd для загрузки и нагрузочного тестирования серверов, чтобы получить базовую строку и задать ожидания дисковые пространства прямой производительности.
Ожидаемые события, которые будут отображаться на остальных узлах во время перезагрузки узла.
Можно спокойно пропускать эти события:
Если вы используете виртуальные машины Azure, это событие можно игнорировать: Event ID 32: The driver detected that the device \Device\Harddisk5\DR5 has its write cache enabled. Data corruption may occur.
Снижение производительности или «потеря связи», «ошибка ввода-вывода», «отсоединено» или «нет избыточности» для развертываний, использующих устройства Intel P3x00 NVMe
мы обнаружили критическую ошибку, которая влияет на некоторые дисковые пространства пользователей, использующих оборудование на базе семейства Intel P3x00 нвм Express (NVMe) с версиями встроенного по до «технического выпуска 8».
У отдельных изготовителей оборудования могут быть устройства, основанные на семействе устройств NVMe семейства Intel P3x00 с уникальными строками версий встроенного по. Обратитесь к изготовителю оборудования за дополнительными сведениями о последней версии встроенного по.
Если в развертывании используется оборудование, основанное на семействе устройств NVMe под управлением Intel P3x00, рекомендуется немедленно применить последнюю версию доступного встроенного по (по крайней мере в техническом выпуске 8). В этой статье Служба поддержки Майкрософт содержатся дополнительные сведения об этой ошибке.








