気の向くままに辿るIT/ICT
ソフトウェア

GPT-3のExamples/Write a Python docstringを試してみた

ホーム前へ次へ
フリーソフト・オープンソースを活用しよう。

GPT-3のExamples/Write a Python docstringを試してみた

GPT-3のExamples/Write a Python docstringを試してみた

2021/12/01

 OpenAIの自然言語処理モデルGPT-3のExamples/Write a Python docstringを試してみました。

Write a Python docstring

debian:~$ python openai_examples_python_docstring.py
Traceback (most recent call last):
 File "/path/to/openai_examples_explain_code.py", line 10, in
  response = openai.Completion.create(
 File "/home/xxx/.local/lib/python3.9/site-packages/openai/api_resources/completion.py", line 31, in create
  return super().create(*args, **kwargs)
 File "/home/xxx/.local/lib/python3.9/site-packages/openai/api_resources/abstract/engine_api_resource.py", line 65, in create
  response, _, api_key = requestor.request(
 File "/home/xxx/.local/lib/python3.9/site-packages/openai/api_requestor.py", line 107, in request
  resp, got_stream = self._interpret_response(result, stream)
 File "/home/xxx/.local/lib/python3.9/site-packages/openai/api_requestor.py", line 292, in _interpret_response
  self._interpret_response_line(
 File "/home/xxx/.local/lib/python3.9/site-packages/openai/api_requestor.py", line 318, in _interpret_response_line
  raise self.handle_error_response(
openai.error.InvalidRequestError: Engine not found
debian:~$

 Pythonのソースコードに対してPythonにおいてhelp関数からも参照・表示される関数の:(コロン)直後に3連などのシングルクォートやダブルクォートで挟んだ説明文docstringを書いてくれるWrite a Python docstring

 残念ながら、現時点では、Explain codePython bug fixerJavaScript helper chatbotJavaScript one line functionNatural language to OpenAI API等々と同様、後述のスクリプトで指定の処理エンジンdavinci-codexがないエラーが出ます。

OpenAI GPT-3 codex利用申請フォームリンクの場所
2021/12/04

 あ、一通り終わってよく見たら、各Examplesの右上に[Open in Playground]というボタンがあり、(davinci-)codexを使うものは背景がグレーアウトでポイントは可、クリック不可、それ以外はグリーンでクリック可能でWebエディタ?に遷移するようになっていました。

 でグレーアウトされた[Open in Playground]をマウスでポイントして文中の[join the waitlist]のリンクをクリックすると申請フォームに遷移、登録後、しばらく待って利用可能メールがくれば晴れてcodexエンジンを使えるようになるとのこと。

 これは、現時点ではプライベートベータ版であるCodexモデルシリーズを使うサンプルで、やってみたいなら待機リストに登録してねってことのようです。

debian:~$ cat openai_examples_python_docstring.py
import openai
import os
import json
 
openai.api_key = os.getenv("OPENAI_API_KEY")
#prompt="# Python 3.7\n \ndef randomly_split_dataset(folder, filename, split_ratio=[0.8, 0.2]):\n df = pd.read_json(folder + filename, lines=True)\n train_name, test_name = \"train.jsonl\", \"test.jsonl\"\n df_train, df_test = train_test_split(df, test_size=split_ratio[1], random_state=42)\n df_train.to_json(folder + train_name, orient='records', lines=True)\n df_test.to_json(folder + test_name, orient='records', lines=True)\nrandomly_split_dataset('finetune_data/', 'dataset.jsonl')\n \n# An elaborate, high quality docstring for the above function:\n\"\"\"",
#prompt="",
 
response = openai.Completion.create(
 engine="davinci-codex",
 prompt=prompt,
 temperature=0,
 max_tokens=150,
 top_p=1.0,
 frequency_penalty=0.0,
 presence_penalty=0.0,
 stop=["#", "\"\"\""]
)
#print(prompt)
print(str(prompt))
print(" ")
print(response['choices'][0]['text'])
#print(str(response['choices'][0]['text']))
#print(json.dumps(response, ensure_ascii=False, indent=2))
debian:~$

 ソースはこんな感じ、環境変数OPENAI_API_KEYに自分のAPIキーが入っている前提です。

 そのままでは想定通り機能しないので一部オリジナルソースから変更しています。

 print()、もしくは、json出力しないと実行しても何も表示されないので何れかを追加する必要があり、後者用にimport jsonを追加。

 が、応答内容によっては、何れか一方では表示できないことがあり、他方を使用せざるを得ないこともあります。

 表示できないのが、print文なら、response配列を文字列にキャストすれば、たいていは凌げますが。

 応答文だけだとチャット状態にならず、問いかけ文も表示したいところ。

 が、サンプル通りだとprintやjson形式で出力しようにも問いかけ用の変数promptがスコープの範囲になく、スコープに入るようPythonの場合だとインデント階層を相応に上げたところで変数が登場(変数宣言)するようにする必要があります。

 また、promptの中身によっては、文字列にキャストしないとエラーとなるケースもありました。

ホーム前へ次へ