diff --git a/page.go b/page.go index 39459c6..be1e257 100644 --- a/page.go +++ b/page.go @@ -77,6 +77,12 @@ func isarticle(url string) bool { return len(chk) > 2 && chk[0] == "/view_news.pl?id" } +/* 出版社かの確認 */ +func ispublish(url string) bool { + chk := strings.Split(url, "=") + return len(chk) > 1 && chk[0] == "/list_news_media.pl?id" +} + /* カテゴリーだけが残るまで消す */ func rmcbloat(body string, cnf Config) string { var re *regexp.Regexp @@ -149,6 +155,35 @@ func rmebloat(body string, cnf Config) string { return body } +/* 出版社だけが残るまで消す */ +func rmpbloat(body string, cnf Config) string { + var re *regexp.Regexp + + rep := []struct { + pat string + repl string + }{ + {`(?s).*?
`, ""}, + {`(?s).*?`, ""}, + {`(?s)
.*?

`, `

`}, + {`(?s)

\n" + strings.TrimSpace(body)) + "\n
\n" + return body +} + /* 記事だけが残るまで消す */ func rmbloat(body string, cnf Config) string { var re *regexp.Regexp @@ -174,6 +209,7 @@ func rmbloat(body string, cnf Config) string { {`