با استفاده از regex زیر میشه تگهای گفته شده رو تشخیص داد:
"</?(html|head|body)[^>]*>"
مثال زیر، این تگها رو از رشتهی ورودی حذف میکنه:
String input = "<html><head> <title>remove head and body of html</title> </head><body bgcolor=\"white\"> <div class=\"intro\"/> </body></html>";
String replaced = input.replaceAll("</?(html|head|body)[^>]*>", "");
خروجی:
<title>remove head and body of html</title> <div class="intro"/>