发布时间:2024-11-22 01:52:51
安装完成后,您可以通过在终端中运行go version
命令来验证是否成功安装。如果显示了Golang的版本信息,则说明安装成功。
go get
命令来自动下载并安装这些依赖项。
首先,我们需要使用以下命令来安装“goquery”包:
go get github.com/PuerkitoBio/goquery
然后,我们使用以下命令来安装“net/http”包:
go get net/http
在“main.go”文件中,我们需要导入所需的包,并编写一个名为“main”的函数。在这个函数中,我们将定义我们的爬虫逻辑。
```go package main import ( "fmt" "github.com/PuerkitoBio/goquery" "net/http" ) func main() { // 发送HTTP请求 response, err := http.Get("https://example.com") if err != nil { fmt.Println("发生错误:", err) return } defer response.Body.Close() // 解析HTML响应 document, err := goquery.NewDocumentFromReader(response.Body) if err != nil { fmt.Println("解析HTML失败:", err) return } // 提取所需的数据 document.Find("h1").Each(func(index int, element *goquery.Selection) { fmt.Println(element.Text()) }) } ```在这个例子中,我们使用了HTTP包来发送GET请求,并使用goquery包来解析HTML响应。在我们获取到HTML文档之后,我们遍历了所有的H1标签,并打印了它们的文本内容。
go run main.go
如果一切顺利,您将在终端中看到爬取的H1标签文本内容。
例如,您可以使用第三方的库,如“colly”或“gocolly”,来处理较复杂的爬虫逻辑。这些库提供了更高级的功能,比如自动处理链接、异步请求、代理支持等。