Coverage for /pythoncovmergedfiles/medio/medio/usr/local/lib/python3.11/site-packages/airflow/sdk/execution_time/task

1016 return rendered_fields # type: ignore[return-value] # Convince mypy that this is OK since we pass JsonValue to redact, so it will return the same

1017

1018

1019def _build_asset_profiles(lineage_objects: list) -> Iterator[AssetProfile]:

1020 # Lineage can have other types of objects besides assets, so we need to process them a bit.

1021 for obj in lineage_objects or ():

1022 if isinstance(obj, Asset):

1023 yield AssetProfile(name=obj.name, uri=obj.uri, type=Asset.__name__)

1024 elif isinstance(obj, AssetNameRef):

1025 yield AssetProfile(name=obj.name, type=AssetNameRef.__name__)

1026 elif isinstance(obj, AssetUriRef):

1027 yield AssetProfile(uri=obj.uri, type=AssetUriRef.__name__)

1028 elif isinstance(obj, AssetAlias):

1029 yield AssetProfile(name=obj.name, type=AssetAlias.__name__)

1030

1031

1032def _serialize_outlet_events(events: OutletEventAccessorsProtocol) -> Iterator[dict[str, JsonValue]]:

1033 if TYPE_CHECKING:

1034 assert isinstance(events, OutletEventAccessors)

1035 # We just collect everything the user recorded in the accessors.

1036 # Further filtering will be done in the API server.

1037 for key, accessor in events._dict.items():

1038 if isinstance(key, AssetUniqueKey):

1039 yield {"dest_asset_key": attrs.asdict(key), "extra": accessor.extra}

1040 for alias_event in accessor.asset_alias_events:

1041 yield attrs.asdict(alias_event)

1042

1043

1044def _prepare(ti: RuntimeTaskInstance, log: Logger, context: Context) -> ToSupervisor | None:

1045 ti.hostname = get_hostname()

1046 ti.task = ti.task.prepare_for_execution()

1047 # Since context is now cached, and calling `ti.get_template_context` will return the same dict, we want to

1048 # update the value of the task that is sent from there

1049 context["task"] = ti.task

1050

1051 jinja_env = ti.task.dag.get_template_env()

1052 ti.render_templates(context=context, jinja_env=jinja_env)

1053

1054 if rendered_fields := _serialize_rendered_fields(ti.task):

1055 # so that we do not call the API unnecessarily

1056 SUPERVISOR_COMMS.send(msg=SetRenderedFields(rendered_fields=rendered_fields))

1057

1058 # Try to render map_index_template early with available context (will be re-rendered after execution)

1059 # This provides a partial label during task execution for templates using pre-execution context

1060 # If rendering fails here, we suppress the error since it will be re-rendered after execution

1061 try:

1062 if rendered_map_index := _render_map_index(context, ti=ti, log=log):

1063 ti.rendered_map_index = rendered_map_index

1064 log.debug("Sending early rendered map index", length=len(rendered_map_index))

1065 SUPERVISOR_COMMS.send(msg=SetRenderedMapIndex(rendered_map_index=rendered_map_index))

1066 except Exception:

1067 log.debug(

1068 "Early rendering of map_index_template failed, will retry after task execution", exc_info=True

1069 )

1070

1071 _validate_task_inlets_and_outlets(ti=ti, log=log)

1072

1073 try:

1074 # TODO: Call pre execute etc.

1075 get_listener_manager().hook.on_task_instance_running(

1076 previous_state=TaskInstanceState.QUEUED, task_instance=ti

1077 )

1078 except Exception:

1079 log.exception("error calling listener")

1080

1081 # No error, carry on and execute the task

1082 return None

1083

1084

1085def _validate_task_inlets_and_outlets(*, ti: RuntimeTaskInstance, log: Logger) -> None:

1086 if not ti.task.inlets and not ti.task.outlets:

1087 return

1088

1089 inactive_assets_resp = SUPERVISOR_COMMS.send(msg=ValidateInletsAndOutlets(ti_id=ti.id))

1090 if TYPE_CHECKING:

1091 assert isinstance(inactive_assets_resp, InactiveAssetsResult)

1092 if inactive_assets := inactive_assets_resp.inactive_assets:

1093 raise AirflowInactiveAssetInInletOrOutletException(

1094 inactive_asset_keys=[

1095 AssetUniqueKey.from_profile(asset_profile) for asset_profile in inactive_assets

1096 ]

1097 )

1098

1099

1100def _defer_task(

1101 defer: TaskDeferred, ti: RuntimeTaskInstance, log: Logger

1102) -> tuple[ToSupervisor, TaskInstanceState]:

1103 # TODO: Should we use structlog.bind_contextvars here for dag_id, task_id & run_id?

1104

1105 log.info("Pausing task as DEFERRED. ", dag_id=ti.dag_id, task_id=ti.task_id, run_id=ti.run_id)

1106 classpath, trigger_kwargs = defer.trigger.serialize()

1107 queue: str | None = None

1108 # Currently, only task-associated BaseTrigger instances may have a non-None queue,

1109 # and only when triggerer.queues_enabled conf is True.

1110 if conf.getboolean("triggerer", "queues_enabled", fallback=False) and getattr(

1111 defer.trigger, "supports_triggerer_queue", True

1112 ):

1113 queue = ti.task.queue

1114

1115 from airflow.sdk.serde import serialize as serde_serialize

1116

1117 trigger_kwargs = serde_serialize(trigger_kwargs)

1118 next_kwargs = serde_serialize(defer.kwargs or {})

1119

1120 if TYPE_CHECKING:

1121 assert isinstance(next_kwargs, dict)

1122 assert isinstance(trigger_kwargs, dict)

1123

1124 msg = DeferTask(

1125 classpath=classpath,

1126 trigger_kwargs=trigger_kwargs,

1127 trigger_timeout=defer.timeout,

1128 queue=queue,

1129 next_method=defer.method_name,

1130 next_kwargs=next_kwargs,

1131 )

1132 state = TaskInstanceState.DEFERRED

1133

1134 return msg, state

1135

1136

1137@Sentry.enrich_errors

1138def run(

1139 ti: RuntimeTaskInstance,

1140 context: Context,

1141 log: Logger,

1142) -> tuple[TaskInstanceState, ToSupervisor | None, BaseException | None]:

1143 """Run the task in this process."""

1144 import signal

1145

1146 from airflow.sdk.exceptions import (

1147 AirflowFailException,

1148 AirflowRescheduleException,

1149 AirflowSensorTimeout,

1150 AirflowSkipException,

1151 AirflowTaskTerminated,

1152 DagRunTriggerException,

1153 DownstreamTasksSkipped,

1154 TaskDeferred,

1155 )

1156

1157 if TYPE_CHECKING:

1158 assert ti.task is not None

1159 assert isinstance(ti.task, BaseOperator)

1160

1161 parent_pid = os.getpid()

1162

1163 def _on_term(signum, frame):

1164 pid = os.getpid()

1165 if pid != parent_pid:

1166 return

1167

1168 ti.task.on_kill()

1169

1170 signal.signal(signal.SIGTERM, _on_term)

1171

1172 msg: ToSupervisor | None = None

1173 state: TaskInstanceState

1174 error: BaseException | None = None

1175

1176 try:

1177 # First, clear the xcom data sent from server

1178 if ti._ti_context_from_server and (keys_to_delete := ti._ti_context_from_server.xcom_keys_to_clear):

1179 for x in keys_to_delete:

1180 log.debug("Clearing XCom with key", key=x)

1181 XCom.delete(

1182 key=x,

1183 dag_id=ti.dag_id,

1184 task_id=ti.task_id,

1185 run_id=ti.run_id,

1186 map_index=ti.map_index,

1187 )

1188

1189 with set_current_context(context):

1190 # This is the earliest that we can render templates -- as if it excepts for any reason we need to

1191 # catch it and handle it like a normal task failure

1192 if early_exit := _prepare(ti, log, context):

1193 msg = early_exit

1194 ti.state = state = TaskInstanceState.FAILED

1195 return state, msg, error

1196

1197 try:

1198 result = _execute_task(context=context, ti=ti, log=log)

1199 except Exception:

1200 import jinja2

1201

1202 # If the task failed, swallow rendering error so it doesn't mask the main error.

1203 with contextlib.suppress(jinja2.TemplateSyntaxError, jinja2.UndefinedError):

1204 previous_rendered_map_index = ti.rendered_map_index

1205 ti.rendered_map_index = _render_map_index(context, ti=ti, log=log)

1206 # Send update only if value changed (e.g., user set context variables during execution)

1207 if ti.rendered_map_index and ti.rendered_map_index != previous_rendered_map_index:

1208 SUPERVISOR_COMMS.send(

1209 msg=SetRenderedMapIndex(rendered_map_index=ti.rendered_map_index)

1210 )

1211 raise

1212 else: # If the task succeeded, render normally to let rendering error bubble up.

1213 previous_rendered_map_index = ti.rendered_map_index

1214 ti.rendered_map_index = _render_map_index(context, ti=ti, log=log)

1215 # Send update only if value changed (e.g., user set context variables during execution)

1216 if ti.rendered_map_index and ti.rendered_map_index != previous_rendered_map_index:

1217 SUPERVISOR_COMMS.send(msg=SetRenderedMapIndex(rendered_map_index=ti.rendered_map_index))

1218

1219 _push_xcom_if_needed(result, ti, log)

1220

1221 msg, state = _handle_current_task_success(context, ti)

1222 except DownstreamTasksSkipped as skip:

1223 log.info("Skipping downstream tasks.")

1224 tasks_to_skip = skip.tasks if isinstance(skip.tasks, list) else [skip.tasks]

1225 SUPERVISOR_COMMS.send(msg=SkipDownstreamTasks(tasks=tasks_to_skip))

1226 msg, state = _handle_current_task_success(context, ti)

1227 except DagRunTriggerException as drte:

1228 msg, state = _handle_trigger_dag_run(drte, context, ti, log)

1229 except TaskDeferred as defer:

1230 msg, state = _defer_task(defer, ti, log)

1231 except AirflowSkipException as e:

1232 if e.args:

1233 log.info("Skipping task.", reason=e.args[0])

1234 msg = TaskState(

1235 state=TaskInstanceState.SKIPPED,

1236 end_date=datetime.now(tz=timezone.utc),

1237 rendered_map_index=ti.rendered_map_index,

1238 )

1239 state = TaskInstanceState.SKIPPED

1240 except AirflowRescheduleException as reschedule:

1241 log.info("Rescheduling task, marking task as UP_FOR_RESCHEDULE")

1242 msg = RescheduleTask(

1243 reschedule_date=reschedule.reschedule_date, end_date=datetime.now(tz=timezone.utc)

1244 )

1245 state = TaskInstanceState.UP_FOR_RESCHEDULE

1246 except (AirflowFailException, AirflowSensorTimeout) as e:

1247 # If AirflowFailException is raised, task should not retry.

1248 # If a sensor in reschedule mode reaches timeout, task should not retry.

1249 log.exception("Task failed with exception")

1250 ti.end_date = datetime.now(tz=timezone.utc)

1251 msg = TaskState(

1252 state=TaskInstanceState.FAILED,

1253 end_date=ti.end_date,

1254 rendered_map_index=ti.rendered_map_index,

1255 )

1256 state = TaskInstanceState.FAILED

1257 error = e

1258 except (AirflowTaskTimeout, AirflowException, AirflowRuntimeError) as e:

1259 # We should allow retries if the task has defined it.

1260 log.exception("Task failed with exception")

1261 msg, state = _handle_current_task_failed(ti)

1262 error = e

1263 except AirflowTaskTerminated as e:

1264 # External state updates are already handled with `ti_heartbeat` and will be

1265 # updated already be another UI API. So, these exceptions should ideally never be thrown.

1266 # If these are thrown, we should mark the TI state as failed.

1267 log.exception("Task failed with exception")

1268 ti.end_date = datetime.now(tz=timezone.utc)

1269 msg = TaskState(

1270 state=TaskInstanceState.FAILED,

1271 end_date=ti.end_date,

1272 rendered_map_index=ti.rendered_map_index,

1273 )

1274 state = TaskInstanceState.FAILED

1275 error = e

1276 except SystemExit as e:

1277 # SystemExit needs to be retried if they are eligible.

1278 log.error("Task exited", exit_code=e.code)

1279 msg, state = _handle_current_task_failed(ti)

1280 error = e

1281 except BaseException as e:

1282 log.exception("Task failed with exception")

1283 msg, state = _handle_current_task_failed(ti)

1284 error = e

1285 finally:

1286 if msg:

1287 SUPERVISOR_COMMS.send(msg=msg)

1288

1289 # Return the message to make unit tests easier too

1290 ti.state = state

1291 return state, msg, error

1292

1293

1294def _handle_current_task_success(

1295 context: Context,

1296 ti: RuntimeTaskInstance,

1297) -> tuple[SucceedTask, TaskInstanceState]:

1298 end_date = datetime.now(tz=timezone.utc)

1299 ti.end_date = end_date

1300

1301 # Record operator and task instance success metrics

1302 operator = ti.task.__class__.__name__

1303 stats_tags = {"dag_id": ti.dag_id, "task_id": ti.task_id}

1304

1305 Stats.incr(f"operator_successes_{operator}", tags=stats_tags)

1306 # Same metric with tagging

1307 Stats.incr("operator_successes", tags={**stats_tags, "operator": operator})

1308 Stats.incr("ti_successes", tags=stats_tags)

1309

1310 task_outlets = list(_build_asset_profiles(ti.task.outlets))

1311 outlet_events = list(_serialize_outlet_events(context["outlet_events"]))

1312 msg = SucceedTask(

1313 end_date=end_date,

1314 task_outlets=task_outlets,

1315 outlet_events=outlet_events,

1316 rendered_map_index=ti.rendered_map_index,

1317 )

1318 return msg, TaskInstanceState.SUCCESS

1319

1320

1321def _handle_current_task_failed(

1322 ti: RuntimeTaskInstance,

1323) -> tuple[RetryTask, TaskInstanceState] | tuple[TaskState, TaskInstanceState]:

1324 end_date = datetime.now(tz=timezone.utc)

1325 ti.end_date = end_date

1326

1327 # Record operator and task instance failed metrics

1328 operator = ti.task.__class__.__name__

1329 stats_tags = {"dag_id": ti.dag_id, "task_id": ti.task_id}

1330

1331 Stats.incr(f"operator_failures_{operator}", tags=stats_tags)

1332 # Same metric with tagging

1333 Stats.incr("operator_failures", tags={**stats_tags, "operator": operator})

1334 Stats.incr("ti_failures", tags=stats_tags)

1335

1336 if ti._ti_context_from_server and ti._ti_context_from_server.should_retry:

1337 return RetryTask(end_date=end_date), TaskInstanceState.UP_FOR_RETRY

1338 return (

1339 TaskState(

1340 state=TaskInstanceState.FAILED, end_date=end_date, rendered_map_index=ti.rendered_map_index

1341 ),

1342 TaskInstanceState.FAILED,

1343 )

1344

1345

1346def _handle_trigger_dag_run(

1347 drte: DagRunTriggerException, context: Context, ti: RuntimeTaskInstance, log: Logger

1348) -> tuple[ToSupervisor, TaskInstanceState]:

1349 """Handle exception from TriggerDagRunOperator."""

1350 log.info("Triggering Dag Run.", trigger_dag_id=drte.trigger_dag_id)

1351 comms_msg = SUPERVISOR_COMMS.send(

1352 TriggerDagRun(

1353 dag_id=drte.trigger_dag_id,

1354 run_id=drte.dag_run_id,

1355 logical_date=drte.logical_date,

1356 conf=drte.conf,

1357 reset_dag_run=drte.reset_dag_run,

1358 ),

1359 )

1360

1361 if isinstance(comms_msg, ErrorResponse) and comms_msg.error == ErrorType.DAGRUN_ALREADY_EXISTS:

1362 if drte.skip_when_already_exists:

1363 log.info(

1364 "Dag Run already exists, skipping task as skip_when_already_exists is set to True.",

1365 dag_id=drte.trigger_dag_id,

1366 )

1367 msg = TaskState(

1368 state=TaskInstanceState.SKIPPED,

1369 end_date=datetime.now(tz=timezone.utc),

1370 rendered_map_index=ti.rendered_map_index,

1371 )

1372 state = TaskInstanceState.SKIPPED

1373 else:

1374 log.error("Dag Run already exists, marking task as failed.", dag_id=drte.trigger_dag_id)

1375 msg = TaskState(

1376 state=TaskInstanceState.FAILED,

1377 end_date=datetime.now(tz=timezone.utc),

1378 rendered_map_index=ti.rendered_map_index,

1379 )

1380 state = TaskInstanceState.FAILED

1381

1382 return msg, state

1383

1384 log.info("Dag Run triggered successfully.", trigger_dag_id=drte.trigger_dag_id)

1385

1386 # Store the run id from the dag run (either created or found above) to

1387 # be used when creating the extra link on the webserver.

1388 ti.xcom_push(key="trigger_run_id", value=drte.dag_run_id)

1389

1390 if drte.wait_for_completion:

1391 if drte.deferrable:

1392 from airflow.providers.standard.triggers.external_task import DagStateTrigger

1393

1394 defer = TaskDeferred(

1395 trigger=DagStateTrigger(

1396 dag_id=drte.trigger_dag_id,

1397 states=drte.allowed_states + drte.failed_states, # type: ignore[arg-type]

1398 # Don't filter by execution_dates when run_ids is provided.

1399 # run_id uniquely identifies a DAG run, and when reset_dag_run=True,

1400 # drte.logical_date might be a newly calculated value that doesn't match

1401 # the persisted logical_date in the database, causing the trigger to never find the run.

1402 execution_dates=None,

1403 run_ids=[drte.dag_run_id],

1404 poll_interval=drte.poke_interval,

1405 ),

1406 method_name="execute_complete",

1407 )

1408 return _defer_task(defer, ti, log)

1409 while True:

1410 log.info(

1411 "Waiting for dag run to complete execution in allowed state.",

1412 dag_id=drte.trigger_dag_id,

1413 run_id=drte.dag_run_id,

1414 allowed_state=drte.allowed_states,

1415 )

1416 time.sleep(drte.poke_interval)

1417

1418 comms_msg = SUPERVISOR_COMMS.send(

1419 GetDagRunState(dag_id=drte.trigger_dag_id, run_id=drte.dag_run_id)

1420 )

1421 if TYPE_CHECKING:

1422 assert isinstance(comms_msg, DagRunStateResult)

1423 if comms_msg.state in drte.failed_states:

1424 log.error(

1425 "DagRun finished with failed state.", dag_id=drte.trigger_dag_id, state=comms_msg.state

1426 )

1427 msg = TaskState(

1428 state=TaskInstanceState.FAILED,

1429 end_date=datetime.now(tz=timezone.utc),

1430 rendered_map_index=ti.rendered_map_index,

1431 )

1432 state = TaskInstanceState.FAILED

1433 return msg, state

1434 if comms_msg.state in drte.allowed_states:

1435 log.info(

1436 "DagRun finished with allowed state.", dag_id=drte.trigger_dag_id, state=comms_msg.state

1437 )

1438 break

1439 log.debug(

1440 "DagRun not yet in allowed or failed state.",

1441 dag_id=drte.trigger_dag_id,

1442 state=comms_msg.state,

1443 )

1444 else:

1445 # Fire-and-forget mode: wait_for_completion=False

1446 if drte.deferrable:

1447 log.info(

1448 "Ignoring deferrable=True because wait_for_completion=False. "

1449 "Task will complete immediately without waiting for the triggered DAG run.",

1450 trigger_dag_id=drte.trigger_dag_id,

1451 )

1452

1453 return _handle_current_task_success(context, ti)

1454

1455

1456def _run_task_state_change_callbacks(

1457 task: BaseOperator,

1458 kind: Literal[

1459 "on_execute_callback",

1460 "on_failure_callback",

1461 "on_success_callback",

1462 "on_retry_callback",

1463 "on_skipped_callback",

1464 ],

1465 context: Context,

1466 log: Logger,

1467) -> None:

1468 callback: Callable[[Context], None]

1469 for i, callback in enumerate(getattr(task, kind)):

1470 try:

1471 create_executable_runner(callback, context_get_outlet_events(context), logger=log).run(context)

1472 except Exception:

1473 log.exception("Failed to run task callback", kind=kind, index=i, callback=callback)

1474

1475

1476def _send_error_email_notification(

1477 task: BaseOperator | MappedOperator,

1478 ti: RuntimeTaskInstance,

1479 context: Context,

1480 error: BaseException | str | None,

1481 log: Logger,

1482) -> None:

1483 """Send email notification for task errors using SmtpNotifier."""

1484 try:

1485 from airflow.providers.smtp.notifications.smtp import SmtpNotifier

1486 except ImportError:

1487 log.error(

1488 "Failed to send task failure or retry email notification: "

1489 "`apache-airflow-providers-smtp` is not installed. "

1490 "Install this provider to enable email notifications."

1491 )

1492 return

1493

1494 if not task.email:

1495 return

1496

1497 subject_template_file = conf.get("email", "subject_template", fallback=None)

1498

1499 # Read the template file if configured

1500 if subject_template_file and Path(subject_template_file).exists():

1501 subject = Path(subject_template_file).read_text()

1502 else:

1503 # Fallback to default

1504 subject = "Airflow alert: {{ti}}"

1505

1506 html_content_template_file = conf.get("email", "html_content_template", fallback=None)

1507

1508 # Read the template file if configured

1509 if html_content_template_file and Path(html_content_template_file).exists():

1510 html_content = Path(html_content_template_file).read_text()

1511 else:

1512 # Fallback to default

1513 # For reporting purposes, we report based on 1-indexed,

1514 # not 0-indexed lists (i.e. Try 1 instead of Try 0 for the first attempt).

1515 html_content = (

1516 "Try {{try_number}} out of {{max_tries + 1}} "

1517 "Exception: {{exception_html}} "

1518 'Log: <a href="{{ti.log_url}}">Link</a> '

1519 "Host: {{ti.hostname}} "

1520 'Mark success: <a href="{{ti.mark_success_url}}">Link</a> '

1521 )

1522

1523 # Add exception_html to context for template rendering

1524 import html

1525

1526 exception_html = html.escape(str(error)).replace("\n", " ")

1527 additional_context = {

1528 "exception": error,

1529 "exception_html": exception_html,

1530 "try_number": ti.try_number,

1531 "max_tries": ti.max_tries,

1532 }

1533 email_context = {**context, **additional_context}

1534 to_emails = task.email

1535 if not to_emails:

1536 return

1537

1538 try:

1539 notifier = SmtpNotifier(

1540 to=to_emails,

1541 subject=subject,

1542 html_content=html_content,

1543 from_email=conf.get("email", "from_email", fallback="airflow@airflow"),

1544 )

1545 notifier(email_context)

1546 except Exception:

1547 log.exception("Failed to send email notification")

1548

1549

1550def _execute_task(context: Context, ti: RuntimeTaskInstance, log: Logger):

1551 """Execute Task (optionally with a Timeout) and push Xcom results."""

1552 task = ti.task

1553 execute = task.execute

1554

1555 if ti._ti_context_from_server and (next_method := ti._ti_context_from_server.next_method):

1556 from airflow.sdk.serde import deserialize

1557

1558 next_kwargs_data = ti._ti_context_from_server.next_kwargs or {}

1559 try:

1560 if TYPE_CHECKING:

1561 assert isinstance(next_kwargs_data, dict)

1562 kwargs = deserialize(next_kwargs_data)

1563 except (ImportError, KeyError, AttributeError, TypeError):

1564 from airflow.serialization.serialized_objects import BaseSerialization

1565

1566 kwargs = BaseSerialization.deserialize(next_kwargs_data)

1567

1568 if TYPE_CHECKING:

1569 assert isinstance(kwargs, dict)

1570 execute = functools.partial(task.resume_execution, next_method=next_method, next_kwargs=kwargs)

1571

1572 ctx = contextvars.copy_context()

1573 # Populate the context var so ExecutorSafeguard doesn't complain

1574 ctx.run(ExecutorSafeguard.tracker.set, task)

1575

1576 # Export context in os.environ to make it available for operators to use.

1577 airflow_context_vars = context_to_airflow_vars(context, in_env_var_format=True)

1578 os.environ.update(airflow_context_vars)

1579

1580 outlet_events = context_get_outlet_events(context)

1581

1582 if (pre_execute_hook := task._pre_execute_hook) is not None:

1583 create_executable_runner(pre_execute_hook, outlet_events, logger=log).run(context)

1584 if getattr(pre_execute_hook := task.pre_execute, "__func__", None) is not BaseOperator.pre_execute:

1585 create_executable_runner(pre_execute_hook, outlet_events, logger=log).run(context)

1586

1587 _run_task_state_change_callbacks(task, "on_execute_callback", context, log)

1588

1589 if task.execution_timeout:

1590 from airflow.sdk.execution_time.timeout import timeout

1591

1592 # TODO: handle timeout in case of deferral

1593 timeout_seconds = task.execution_timeout.total_seconds()

1594 try:

1595 # It's possible we're already timed out, so fast-fail if true

1596 if timeout_seconds <= 0:

1597 raise AirflowTaskTimeout()

1598 # Run task in timeout wrapper

1599 with timeout(timeout_seconds):

1600 result = ctx.run(execute, context=context)

1601 except AirflowTaskTimeout:

1602 task.on_kill()

1603 raise

1604 else:

1605 result = ctx.run(execute, context=context)

1606

1607 if (post_execute_hook := task._post_execute_hook) is not None:

1608 create_executable_runner(post_execute_hook, outlet_events, logger=log).run(context, result)

1609 if getattr(post_execute_hook := task.post_execute, "__func__", None) is not BaseOperator.post_execute:

1610 create_executable_runner(post_execute_hook, outlet_events, logger=log).run(context)

1611

1612 return result

1613

1614

1615def _render_map_index(context: Context, ti: RuntimeTaskInstance, log: Logger) -> str | None:

1616 """Render named map index if the Dag author defined map_index_template at the task level."""

1617 if (template := context.get("map_index_template")) is None:

1618 return None

1619 log.debug("Rendering map_index_template", template_length=len(template))

1620 jinja_env = ti.task.dag.get_template_env()

1621 rendered_map_index = jinja_env.from_string(template).render(context)

1622 log.debug("Map index rendered", length=len(rendered_map_index))

1623 return rendered_map_index

1624

1625

1626def _push_xcom_if_needed(result: Any, ti: RuntimeTaskInstance, log: Logger):

1627 """Push XCom values when task has ``do_xcom_push`` set to ``True`` and the task returns a result."""

1628 if ti.task.do_xcom_push:

1629 xcom_value = result

1630 else:

1631 xcom_value = None

1632

1633 has_mapped_dep = next(ti.task.iter_mapped_dependants(), None) is not None

1634 if xcom_value is None:

1635 if not ti.is_mapped and has_mapped_dep:

1636 # Uhoh, a downstream mapped task depends on us to push something to map over

1637 from airflow.sdk.exceptions import XComForMappingNotPushed

1638

1639 raise XComForMappingNotPushed()

1640 return

1641

1642 mapped_length: int | None = None

1643 if not ti.is_mapped and has_mapped_dep:

1644 from airflow.sdk.definitions.mappedoperator import is_mappable_value

1645 from airflow.sdk.exceptions import UnmappableXComTypePushed

1646

1647 if not is_mappable_value(xcom_value):

1648 raise UnmappableXComTypePushed(xcom_value)

1649 mapped_length = len(xcom_value)

1650

1651 log.info("Pushing xcom", ti=ti)

1652

1653 # If the task has multiple outputs, push each output as a separate XCom.

1654 if ti.task.multiple_outputs:

1655 if not isinstance(xcom_value, Mapping):

1656 raise TypeError(

1657 f"Returned output was type {type(xcom_value)} expected dictionary for multiple_outputs"

1658 )

1659 for key in xcom_value.keys():

1660 if not isinstance(key, str):

1661 raise TypeError(

1662 "Returned dictionary keys must be strings when using "

1663 f"multiple_outputs, found {key} ({type(key)}) instead"

1664 )

1665 for k, v in result.items():

1666 ti.xcom_push(k, v)

1667

1668 _xcom_push(ti, BaseXCom.XCOM_RETURN_KEY, result, mapped_length=mapped_length)

1669

1670

1671def finalize(

1672 ti: RuntimeTaskInstance,

1673 state: TaskInstanceState,

1674 context: Context,

1675 log: Logger,

1676 error: BaseException | None = None,

1677):

1678 # Record task duration metrics for all terminal states

1679 if ti.start_date and ti.end_date:

1680 duration_ms = (ti.end_date - ti.start_date).total_seconds() * 1000

1681 stats_tags = {"dag_id": ti.dag_id, "task_id": ti.task_id}

1682

1683 Stats.timing(f"dag.{ti.dag_id}.{ti.task_id}.duration", duration_ms)

1684 Stats.timing("task.duration", duration_ms, tags=stats_tags)

1685

1686 task = ti.task

1687 # Pushing xcom for each operator extra links defined on the operator only.

1688 for oe in task.operator_extra_links:

1689 try:

1690 link, xcom_key = oe.get_link(operator=task, ti_key=ti), oe.xcom_key # type: ignore[arg-type]

1691 log.debug("Setting xcom for operator extra link", link=link, xcom_key=xcom_key)

1692 _xcom_push_to_db(ti, key=xcom_key, value=link)

1693 except Exception:

1694 log.exception(

1695 "Failed to push an xcom for task operator extra link",

1696 link_name=oe.name,

1697 xcom_key=oe.xcom_key,

1698 ti=ti,

1699 )

1700

1701 if getattr(ti.task, "overwrite_rtif_after_execution", False):

1702 log.debug("Overwriting Rendered template fields.")

1703 if ti.task.template_fields:

1704 SUPERVISOR_COMMS.send(SetRenderedFields(rendered_fields=_serialize_rendered_fields(ti.task)))

1705

1706 log.debug("Running finalizers", ti=ti)

1707 if state == TaskInstanceState.SUCCESS:

1708 _run_task_state_change_callbacks(task, "on_success_callback", context, log)

1709 try:

1710 get_listener_manager().hook.on_task_instance_success(

1711 previous_state=TaskInstanceState.RUNNING, task_instance=ti

1712 )

1713 except Exception:

1714 log.exception("error calling listener")

1715 elif state == TaskInstanceState.SKIPPED:

1716 _run_task_state_change_callbacks(task, "on_skipped_callback", context, log)

1717 try:

1718 get_listener_manager().hook.on_task_instance_skipped(

1719 previous_state=TaskInstanceState.RUNNING, task_instance=ti

1720 )

1721 except Exception:

1722 log.exception("error calling listener")

1723 elif state == TaskInstanceState.UP_FOR_RETRY:

1724 _run_task_state_change_callbacks(task, "on_retry_callback", context, log)

1725 try:

1726 get_listener_manager().hook.on_task_instance_failed(

1727 previous_state=TaskInstanceState.RUNNING, task_instance=ti, error=error

1728 )

1729 except Exception:

1730 log.exception("error calling listener")

1731 if error and task.email_on_retry and task.email:

1732 _send_error_email_notification(task, ti, context, error, log)

1733 elif state == TaskInstanceState.FAILED:

1734 _run_task_state_change_callbacks(task, "on_failure_callback", context, log)

1735 try:

1736 get_listener_manager().hook.on_task_instance_failed(

1737 previous_state=TaskInstanceState.RUNNING, task_instance=ti, error=error

1738 )

1739 except Exception:

1740 log.exception("error calling listener")

1741 if error and task.email_on_failure and task.email:

1742 _send_error_email_notification(task, ti, context, error, log)

1743

1744 try:

1745 get_listener_manager().hook.before_stopping(component=TaskRunnerMarker())

1746 except Exception:

1747 log.exception("error calling listener")

1748

1749

1750def main():

1751 log = structlog.get_logger(logger_name="task")

1752

1753 global SUPERVISOR_COMMS

1754 SUPERVISOR_COMMS = CommsDecoder[ToTask, ToSupervisor](log=log)

1755

1756 Stats.initialize(

1757 is_statsd_datadog_enabled=conf.getboolean("metrics", "statsd_datadog_enabled"),

1758 is_statsd_on=conf.getboolean("metrics", "statsd_on"),

1759 is_otel_on=conf.getboolean("metrics", "otel_on"),

1760 )

1761

1762 try:

1763 try:

1764 ti, context, log = startup()

1765 except AirflowRescheduleException as reschedule:

1766 log.warning("Rescheduling task during startup, marking task as UP_FOR_RESCHEDULE")

1767 SUPERVISOR_COMMS.send(

1768 msg=RescheduleTask(

1769 reschedule_date=reschedule.reschedule_date,

1770 end_date=datetime.now(tz=timezone.utc),

1771 )

1772 )

1773 sys.exit(0)

1774 with BundleVersionLock(

1775 bundle_name=ti.bundle_instance.name,

1776 bundle_version=ti.bundle_instance.version,

1777 ):

1778 state, _, error = run(ti, context, log)

1779 context["exception"] = error

1780 finalize(ti, state, context, log, error)

1781 except KeyboardInterrupt:

1782 log.exception("Ctrl-c hit")

1783 sys.exit(2)

1784 except Exception:

1785 log.exception("Top level error")

1786 sys.exit(1)

1787 finally:

1788 # Ensure the request socket is closed on the child side in all circumstances

1789 # before the process fully terminates.

1790 if SUPERVISOR_COMMS and SUPERVISOR_COMMS.socket:

1791 with suppress(Exception):

1792 SUPERVISOR_COMMS.socket.close()

1793

1794

1795def reinit_supervisor_comms() -> None:

1796 """

1797 Re-initialize supervisor comms and logging channel in subprocess.

1798

1799 This is not needed for most cases, but is used when either we re-launch the process via sudo for

1800 run_as_user, or from inside the python code in a virtualenv (et al.) operator to re-connect so those tasks

1801 can continue to access variables etc.

1802 """

1803 import socket

1804

1805 if "SUPERVISOR_COMMS" not in globals():

1806 global SUPERVISOR_COMMS

1807 log = structlog.get_logger(logger_name="task")

1808

1809 fd = int(os.environ.get("__AIRFLOW_SUPERVISOR_FD", "0"))

1810

1811 SUPERVISOR_COMMS = CommsDecoder[ToTask, ToSupervisor](log=log, socket=socket.socket(fileno=fd))

1812

1813 logs = SUPERVISOR_COMMS.send(ResendLoggingFD())

1814 if isinstance(logs, SentFDs):

1815 from airflow.sdk.log import configure_logging

1816

1817 log_io = os.fdopen(logs.fds[0], "wb", buffering=0)

1818 configure_logging(json_output=True, output=log_io, sending_to_supervisor=True)

1819 else:

1820 print("Unable to re-configure logging after sudo, we didn't get an FD", file=sys.stderr)

1821

1822

1823if __name__ == "__main__":

1824 main()

Coverage for /pythoncovmergedfiles/medio/medio/usr/local/lib/python3.11/site-packages/airflow/sdk/execution_time/task_runner.py: 14%

796 statements