WebTextExtractor – Извлечение текста с выбором прокси / прямой запрос

WebTextExtractor

Извлечение текста с сайта — выбор режима: через CORS-прокси или прямой запрос
Адрес страницы
Введите полный URL сайта
Режим подключения:
Прокси помогает обойти CORS, прямой запрос работает только если сайт разрешает кросс-доменные запросы.
Извлечённый текст (очищен от HTML)
  • 1. Вставьте ссылку на веб-страницу (с http:// или https://).
  • 2. Выберите режим: "Через прокси" (рекомендуется) или "Прямой запрос".
  • 3. Прокси-сервер (api.allorigins.win) позволяет загружать страницы любых сайтов, обходя CORS.
  • 4. Прямой запрос работает только если целевой сайт отправляет заголовки CORS (Access-Control-Allow-Origin: *).
  • 5. При ошибке в одном режиме попробуйте переключиться на другой и повторить запрос.
  • 6. После успешной загрузки нажмите «Сохранить в файл» — весь текст сохранится в .txt файл.
Ожидание URL
Режим прокси использует allorigins.win. Прямой режим — нативный fetch. Вы можете переключать метод в любой момент.
Если сайт требует JS-рендеринг, результат может быть ограничен. Для статических HTML-страниц работает отлично.