塩焼きブログ

塩焼きに関しての研究内容を公開しています

複数のHTMLファイルからまとめてscriptタグを削除する

とりあえずscriptタグが含まれているファイルを検索して、それをsedでscriptタグの所を空白で置き換える。

egrep -rl '<script[^>]*><\/script>' ./ | xargs sed -i '' 's/<script[^>]*><\/script>//g'

このようなHTMLがあったとすると

<html>
<head>
  <title>test</title>
</head>
<body>
  hogehoge
<script type="text/javascript" src="analysis.js"></script>
</body>
</html>

このように置き換わる

<html>
<head>
  <title>test</title>
</head>
<body>
  hogehoge

</body>
</html>