Cách chuyển đổi SRT thành văn bản bằng Regex và Javascript

Bạn đang tìm cách chuyển đổi các tệp và văn bản SRT (phụ đề cho phim, sê-ri và phim hoạt hình) thành văn bản bằng regex và javascript? Bài viết này sẽ giúp bạn với điều này và các lựa chọn thay thế khác.

Cách chuyển đổi SRT thành văn bản bằng Javascript và Regex

Để chuyển đổi tệp phụ đề SRT (SubRip Text) thành văn bản bằng regex trong JavaScript, bạn có thể sử dụng chức năng sau:

function convertSrtToText(srt) {
  // Use a expressão regular para remover os números de linha e as marcas de tempo
  return srt.replace(/^\d+\n([\d:,]+ --> [\d:,]+\n)/gm, '');
}

Hàm này sử dụng một biểu thức chính quy để xóa số dòng và dấu thời gian khỏi tệp SRT. Nó trả về văn bản còn lại của tệp SRT, trừ đi số dòng và dấu thời gian.

Để sử dụng chức năng này, chỉ cần gọi nó chuyển nội dung tệp SRT dưới dạng tham số, như trong ví dụ sau:

var srt = "1\n00:00:10,500 --> 00:00:13,000\nTexto da linha 1\n\n2\n00:00:13,500 --> 00:00:16,000\nTexto da linha 2\n\n3\n00:00:16,500 --> 00:00:19,000\nTexto da linha 3\n";
var text = convertSrtToText(srt);
console.log(text); // Exibe "Texto da linha 1\n\nTexto da linha 2\n\nTexto da linha 3\n"

Chuyển đổi SRT bằng Mô-đun JS

Có các lựa chọn thay thế khác để chuyển đổi tệp SRT thành văn bản bằng JavaScript. Dưới đây là một số tùy chọn bạn có thể xem xét:

mô-đun srt-to-vtt

  • Sử dụng mô-đun srt-to-vtt: Mô-đun srt-to-vtt là một gói npm có thể được sử dụng để chuyển đổi các tệp SRT thành văn bản. Để sử dụng nó, bạn cần cài đặt nó bằng lệnh:
  • npm cài đặt srt-to-vtt
  • Sau đó sử dụng đoạn mã sau:
const srtToVtt = require('srt-to-vtt');

srtToVtt.convertSrtToVtt('path/to/input.srt', 'path/to/output.vtt', (err) => {
  if (err) {
    console.error(err);
  } else {
    console.log('Conversão concluída com sucesso');
  }
});

mô-đun srt-to-txt

Sử dụng mô-đun srt-to-txt: Mô-đun srt-to-txt là một gói npm khác có thể được sử dụng để chuyển đổi tệp SRT thành văn bản. Để sử dụng nó, bạn cần cài đặt nó bằng lệnh:

  • npm cài đặt srt-to-txt
const srtToTxt = require('srt-to-txt');

srtToTxt('path/to/input.srt').then((text) => {
  console.log(text);
});

SubRip-Thư viện văn bản

Sử dụng thư viện SubRip-Text: Thư viện SubRip-Text là một thư viện JavaScript có thể được sử dụng để đọc và thao tác với các tệp SRT. Để sử dụng nó, bạn cần cài đặt nó bằng lệnh:

  • npm cài đặt subrip-text
const SubRipText = require('subrip-text');

const srt = new SubRipText('path/to/input.srt');

console.log(srt.getPlainText());

Các cách khác để chuyển đổi SRT sang TXT

Có nhiều cách khác để chuyển đổi tệp SRT thành văn bản (TXT). Một số tùy chọn bạn có thể xem xét là:

  1. Sử dụng công cụ chuyển đổi trực tuyến: có một số trình chuyển đổi trực tuyến cho phép bạn chuyển đổi tệp SRT thành văn bản. Chỉ cần tải tệp SRT lên và trình chuyển đổi sẽ thực hiện chuyển đổi cho bạn.
  2. Sử dụng trình soạn thảo văn bản: nhiều trình soạn thảo văn bản như Notepad++ hoặc Sublime Text có các tùy chọn để xóa số dòng và dấu thời gian khỏi tệp SRT. Bạn có thể sử dụng các tùy chọn này để xóa các thành phần này và lưu tệp dưới dạng tệp văn bản thông thường.
  3. Sử dụng tập lệnh dòng lệnh: nếu bạn đang làm việc với số lượng lớn tệp SRT và cần thực hiện chuyển đổi theo cách tự động, thì có thể hữu ích khi sử dụng tập lệnh dòng lệnh như tập lệnh trong bài viết này.