Начало работы
Подключение
Тесты производительности
Развёртывание
Использование данных
Загрузка данных
Миграция данных
Запрос данных
Управление кластерами
Обновление
Глобальное обслуживание
Масштабирование
Мониторинг
Безопасность
Лучшие практики
Технические принципы
Типы данных
Хранилище
Исполняющий движок
Потоковая обработка (Domino)
MARS3 Индексы
Расширения
Расширенные функции
Расширенный запрос
Федеративные запросы
Grafana
Резервное копирование и восстановление
Аварийное восстановление
Руководство
Настройка производительности
Устранение неполадок
Инструменты
Параметры конфигурации
SQL-команда
Часто задаваемые вопросы
В этом документе приведены часто задаваемые вопросы, связанные с PXF.
remote component error, Failed connect to localhost:5888; Connection refused (libchurl.c:950)После развертывания PXF при попытке доступа к HDFS возникает ошибка:
remote component error,Failed connect to localhost:5888; Connection refused (libchurl.c:950)
Решение
Способ доступа PXF к файлам требует, чтобы сервер PXF был включен на узле Master, однако файл данных должен находиться на сегменте PXF.
pxf/servers/core-site.xml and hdfs-site.xml должен совпадать с файлом конфигурации Hadoop.
pxf/servers/core-site.xml настраивает права доступа пользователя.
Имя пользователя и группа файла на Hadoop должны совпадать с указанным pxf/core-site.xml.
Решение
Добавьте escape 'off' в параметры.
Используйте format 'text:multi'.
Да.
Предварительные условия
PXF может нормально обращаться к S3.
Решение
Скопируйте файл aa.csv, переименуйте его в ab.csv и загрузите в бакет. Путь к файлу: ymatrix/test. В настоящее время файлы ymatrix/test содержат aa.csv и ab.csv. Количество датасетов в ymatrix/test составляет 1000.
DROP FOREIGN TABLE public.chen_test ;
CREATE FOREIGN TABLE public.chen_test (
c1 text,
c2 text,
c3 text
)
SERVER s3server_online
OPTIONS (
format 'csv',
resource 'ymatrix/test/a*.csv',
JSONIFY_ARRAY 'TRUE',
JSONIFY_MAP 'TRUE',
JSONIFY_RECORD 'TRUE'
);
SELECT count(*) FROM chen_test ;
count
-------
2000
(1 row)
Используйте подстановочный знак * для рекурсивного получения всех файлов во всех подкаталогах указанного каталога.
Примечание! Формат файлов, соответствующих подстановочным знакам, должен быть одинаковым; в противном случае будет выдана ошибка.
Да.
Когда файлы в форматах TEXT, CSV, PARQUET и JSON автоматически разбиваются на сегменты размером 128MB, соответствующие сегменты читают их параллельно.