まず、punctuation.sed というファイルに下記の内容を書き込む。
s/\(です\|ます\|ません\) \(と\|から\|し \)/\1\2、/g
s/\(です\|ます\) \(よ\? \?ね \)\?/\1\2。\n\n/g
s/\(でし\|まし\) \(た\)/\1\2。\n\n/g
s/ //g
その後、下記のような sed スクリプトを利用する。
$ cat 変換したいテキスト.txt | gsed -f punctuation.sed > 変換後のテキスト.txt
もしコマンドがないエラー(gsedはgnu-sed)が発生した場合は、brewでインストールする。
$ brew install gnu-sed
参考1:https://qiita.com/shimizu-nowhere/items/2508f2e87daee8cb1083
参考2:https://nskw-style.com/2020/tool/aws-transcription-text-formatting.html