カリキュラム、 プログラム |
【講演趣旨】
本講演は、pythonを使ったデータ処理や分析事例と、生成AI技術が知的財産業務にもたらす変革と可能性を探ることを目的としています。特許データ処理・分析における生成AIの活用方法を紹介し、業務効率の向上と革新的なアプローチの実現を目指します。Python、生成AI、その他ツールの活用法を解説し、参加者が実践的なスキルを習得できるよう構成しています。また、AIを効果的に活用するために必要なスキルセットや、今後の展望についても議論します。本講演を通じて、知的財産に関わる様々な立場の方々が、AI時代における競争力を維持・向上させ、より創造的で戦略的な業務遂行を実現するための知見を提供します。
【講演項目】
(1)pythonについて
・pythonを利用するメリット
・とりあえずサクッと使いたい方向け:
Google Colaboratory,生成AI系のページで対話
・よく使うpythhonライブラリたち:
polars,bertopic,plotly,streamlit,umap,networkx,langchain,(BigQuery)
・実演:Google Colaraboratoryで何かやってみる
・pythonを使う4ステップ:データ処理、分析、可視化、レポート
(1-1)ここが一番大事! データ処理について
・どれを使うべき?:パンダ vs ホッキョクグマ(vs BigQuery)
・読み込み:pl.read_*,pd.read_*
・データ処理いろいろ:.with_columns,filter,.agg,group_by,pivot,extract
・特許データ処理でよく使うデータ処理のムーブ紹介(explode,cumsum,map_elements,pl.when)
・polars100本ノックについて:
・実演:特許データ処理を実際にやってみる
(1-2)データ分析について
・どんな分析が出来るか:色々
・具体例1:異常検知
・具体例2:BERTopic
・具体例3:ネットワーク分析
・具体例4:自分で分類モデルを作る:生成AIに任せた方が良いかも
・具体例5:「事業等のリスク」分析
(1-3)データ可視化について
・polars,pandasとの連携:plotly,networkx,gephi
・イロモノ系可視化(地図と融合、sankey diagram、plotAPI)
・実演:実際可視化してみる
・困ったら生成AIに聞く(x軸、y軸をいれる、目盛りを変える、色を変える)
(1-4)レポート作成について
・手作業は大変:pyhonpython-pptx,MARP
・発展:ダッシュボードにデータを流し込む
・実演:データ処理?BigQueryに投入?LockerSturioにいれてみる
(2)生成AIについて
・色々ある生成AI
・おすすめの使い方:gemini系,claude,gpt-4系,deepinfra、nomicAtlas
・コード・プログラムの中で生成AIを使う:各種APIの使いかた
・最近の流行り:AgentとTool
・ノーコードでおすすめのライブラリ:flowiseAI
・作り込む時におすすめ:LangChain/LAngGraph
・プロダクト化する時におすすめ:GoogleCloud,LangSmith
・生成AIとの協働:「Copilot」としての役割,言葉でプログラミングが出来る
・発展型:cursor,コメントと関数名の大事さ
(3)知っておくと良い情報
・自然言語処理の世界:おすすめ本,自然言語処理100本ノック
・ベクトルデータベース:pineconeとBigQuery
・puythonが遅い!:非同期処理
・ある意味プログラミング不要!ぜんぶBigQueryにまかせて:BigQueryML
・PC使うお作法:bashコマンド
・自分の代わりに調べてくれる:perplexity,youcom,tavily
・調査まとめ・壁打ち:notebookLM,GoogleCloud
|