JupyterでVSCodeを触らせてもらってます。いい感じにデータの抽出ができてました。

芸がないので動画でとってみました↓

しっかり実行結果が文節で分かれています。NLPライブラリも使いました。

こちらをGithubでUPしてみたかったのですが、PHPはだめらしい・・・ということでAWS編に行ってみました。それでも設定が難しすぎる。頼みの綱の先生も連絡取れず。

import pandas as pd
import spacy
import requests
import json

# Excelファイルのパス
file_path = r"C:\Users\sae202311\Desktop\卒業制作\PTAOGOB\wiki_data.xlsx"

# Excelファイルを読み込む
df = pd.read_excel(file_path)

# E列のデータを取得
e_column_data = df.iloc[:, 4]  # 0-indexedで4はE列

# 日本語モデルの読み込み
nlp = spacy.load("ja_core_news_sm")

def analyze_text(text):
    doc = nlp(text)
    
    # 名詞の抽出
    nouns = [token.text for token in doc if token.pos_ == "NOUN"]
    # 動詞の抽出
    verbs = [token.text for token in doc if token.pos_ == "VERB"]
    # 固有表現の抽出
    entities = [(ent.text, ent.label_) for ent in doc.ents]
    
    return {
        "nouns": nouns,
        "verbs": verbs,
        "entities": entities
    }

# GitHub APIの設定
GITHUB_TOKEN = 'YOUR_PERSONAL_ACCESS_TOKEN'  # ここにトークンを入力
REPO_OWNER = 'YOUR_GITHUB_USERNAME'  # GitHubのユーザー名
REPO_NAME = 'YOUR_REPOSITORY_NAME'  # リポジトリ名
WIKI_PAGE_NAME = '分析結果'  # Wikiページ名

# E列の各データを分析し、結果をMarkdown形式で整形
markdown_content = "# 文章分析結果\n\n"

for text in e_column_data:
    result = analyze_text(text)
    markdown_content += "## 分析対象文\n"
    markdown_content += f"{text}\n\n"
    markdown_content += "### 名詞\n"
    markdown_content += ", ".join(result['nouns']) + "\n\n"
    markdown_content += "### 動詞\n"
    markdown_content += ", ".join(result['verbs']) + "\n\n"
    markdown_content += "### 固有表現\n"
    markdown_content += ", ".join([f"{ent[0]} ({ent[1]})" for ent in result['entities']]) + "\n\n"

# GitHub Wikiにアップロード
url = f"https://api.github.com/repos/{REPO_OWNER}/{REPO_NAME}/wiki/pages/{WIKI_PAGE_NAME}"
headers = {
    'Authorization': f'token {GITHUB_TOKEN}',
    'Content-Type': 'application/json'
}
data = {
    'content': markdown_content,
    'message': 'Update analysis results'
}

response = requests.put(url, headers=headers, data=json.dumps(data))

if response.status_code == 200:
    print("Wikiページが更新されました。")
else:
    print(f"エラーが発生しました: {response.status_code} - {response.text}")

で、こちらを参考にトークンを発行しました。ありがとうございます(/_;)

https://dev.classmethod.jp/articles/github-personal-access-tokens

このあたりの設定も参考リンクからだいぶ遷移しているんだけど、それを教えてくれる人はなし・・・

で、結局自分のスターサーバでできるらしいということを知って

できるやないか!泣いた

きっかけはこちらの記事

また、こちらのGithubの一節が見たくて課金もしましたちゃりーん
GitHub Pages PHPあげられるからと言っても要注意だね。

https://dotinstall.com/questions/pv8425w

すっかり涼しくなってきて勉強が面白い時期です。

AWS運用の特権!無料のSSL証明書を取得してからアクセスできなくなったDDNSサービス。。。。泡
もうできる範囲からやるしかないよねという風

テラタームも新規のIPアドレスを入力してもユーザーネームすら認識しません・・・

AWSの参考Link https://aws.taf-jp.com/blog/37623

AWS特化ブログ結構ありますね

Share this content:

By Air

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA